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INTRODUZIONE 



Tutti sono d'accordo che la qualitd della vita e il benesse- 
re della societd nei paesi industrializzati con condizioni 
umane per il lavoro, I'aspettativa di una lunga vita, ci- 
bo ed energia sufficiente, protezione contro Vinclemenza 
della natura, facili trasporti, diveriimenti di ogni gene- 
re si basano su ritrovati di tecnologia. Cib che viene 
dimenticato sta nel fatto che le basi di questi ritrovati 
furono messe qualche tempo fa dagli scienziati i quali 
furono spinti dalla curiosita e non dalle promesse del 
mercato. 

S. Thing, Nobel per la Fisica 1976) 

Queste note, in forma non ancora completa e definitiva, costituiscono il contenuto del 
corso "Calcolo Matriciale" per la laurea specialistica in Ingegneria, Classe dell'Informa- 
zione. 

Le matrici, come tabelle per rappresentare in forma abbreviata le sostituzioni lineari 
(oggi chiamate trasformazioni lineari) fecero la loro apparizione in matematica in lavori 
di Gauss (1777-1855); il termine "matrice" (dal latino mater matris = ventre, il punto 
di origine, la parte piu importante) fu introdotto nel 1850 da J. Sylvester (1814-1897). 
Questi e il suo amico A. Cayley (1821-1895) diedero notevoli contributi alia teoria delle 
matrici e dei determinanti. II concetto di determinante invece e piu antico, risale a G.W. 
Leibnitz (1678), mentre il vocabolo e dovuto a Gauss (1801). 

La scelta degli argomenti per questo corso e stata dettata dalle piu usuali applicazioni 
delle matrici, ma le applicazioni possibili della matematica non sono prevedibili a priori. 
Ad esempio J. Kepler ha usato dopo 1800 anni la teoria delle coniche elaborata da Apollo- 
nio (III sec a. C); il fisico A. Carnack e l'ingegnere G.N. Nounsfield nel 1979 ricevettero 
il premio Nobel per la medicina per gli studi sulla TAC, che si basa sulla teoria della 
trasformata di A. Radon, introdotta da questi nel 1917 per questioni legate alia Teoria 
della Misura; la teoria dei numeri (una delle parti piu ostiche della matematica) fu usata 
da A. Turing, professore di matematica a Cambridge, per decifrare nel 1941 il codice 
enigma usato dai Nazisti durante la II guerra mondiale; l'algebra astratta, in particolare 
lo studio dei campi finiti, interviene in modo essenziale nella costruzione di tutti i sistemi 
di sicurezza legati a trasmissione di dati, per esempio i codici correttori di errori. 

Non vi e nulla di piu pratico di una buona teoria osservava Boltzmann (1844-1906), 
ma gia secoli prima Leonardo (1452-1519), l'ingegnere per antonomasia del Rinascimento, 
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cosi si esprimeva: Studia prima la scienzia, e poi segui la pratica nata da essa scienzia 
. . . Quelli che s'innamoran di pratica senza scienzia son come 'I nocchier ch'entra in 
navilio senza timone o bussola, che mai ha la certezza dove si vada. 

Come si vede nella storia della matematica, anche l'interesse pratico puo essere lo 
stimolo per creare gli oggetti astratti, matematici, ai quali si rivolgera l'attenzione, spesso 
la contemplazione artistica. Ma la maggior parte dei risultati sono raggiunti, come diceva 
C.G. Jacobi, per Vonore dello spirito umano. 

II "bisogno" derivante dal desiderio di comprendere la natura, il funzionamento delle 
cose, ha agito come motore anche dell'inventiva matematica. E' necessaria, percio, una 
maggiore collaborazione tra ingegneri e matematici, molti grandi ingegneri sono stati 
anche grandi matematici e viceversa: Archimede, Erone, Lagrange, Fourier, Monge solo 
per citarne alcuni. 

Limitandoci ai lavori di Informatica e Teoria dei sistemi, piu vicini agli interessi degli 
specializzandi a cui sono rivolte queste dispense, possiamo dire che non c'e parte della 
matematica che a priori possa venire esclusa e dichiarata che "non serve" . 

Ci si imbatte cosi in uno dei grandi misteri della matematica: come puo una scienza 
che sembra slegata dalla realta avere strettissimi legami, quasi inaspettati, con la realta 
fisica? In una conferenza tenuta il 27 gennaio 1921, A. Einstein cosi si esprimeva: A 
questo punto si presenta un enigma che in tutte le eta ha agitato le menti dei ricercatori: 
come e possibile che le matematiche, le quali dopo tutto sono un prodotto del pensiero 
umano, dipendente dalVesperienza, siano cosi ammirevolmente adatte agli oggetti della 
realta? 

La matematica non e una collezione di formule pronte per l'uso, ma e un'attivita 
creativa, intreccio tra tradizione e spirito innovativo. La parola ingegnere proviene da 
"ingegno", potenza creativa dello spirito umano, che costituisce la massima espressione 
del talento e dell'intelligenza. 

Ci auguriamo che i lettori ne tengano conto nell'esercizio della loro professione. 

Giuseppe De Cecco 
Raffaele Vitolo 
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CAPITOLO 1 



LE MATRICI 



NOTA: per le principali definizioni e le operazioni tra matrici, rimandiamo il lettore 
al testo [16]. 

1.1 Premesse 

Le matrici sono molto utili in matematica, permettono di semplificare espressioni 
considerando una tabella di numeri come un singolo ente. Alcuni esempi dimostrano il 
vasto campo di applicazione delle matrici. 

• Si e visto [16] die ogni sistema lineare si puo scrivere con la notazione matriciale 
come AX = B, dove A, X e B sono opportune matrici. 

• Le matrici sono usate nei problemi di decisione, nei quali e necessario procedere ad 
una scelta tra diversi modi di agire. Ad ogni relazione R C S x S si puo associare 
una matrice (matrice booleana), ponendo 1 se (a, b) G R e altrimenti. Se, ad 
esempio, S = {a, b, c, d} ed R e la relazione schematizzata dalla figura, 

a *■ a 

abed 

/l 1 1\ 
10 
10 11 
\0 1 1/ 



• Sono largamente usate nella grafica al computer; infatti, ogni immagine e una 
matrice di pixel con migliaia o milioni di righe e colonne. 

• Google, il notissimo motore di ricerca in Internet, usa il calcolo degli autovalori di 
matrici di grandissime dimensioni per stabilire le correlazioni tra pagine web ogni 
volta che viene effettuata una ricerca. 
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L'importanza della teoria delle matrici non si esaurisce, pero, nella funzione di una 
utile e semplice rappresentazione di fenomeni complessi, ma ha radici piu profonde legate 
alle strutture algebriche di cui le matrici possono dotarsi. 

Ricordiamo, innanzitutto, che l'insieme K m ' n delle matrici di m righe ed n colonne, 
a coefficienti nel campo K, e uno spazio vettoriale rispetto alia somma di matrici ed al 
prodotto di una matrice per uno scalare. Inoltre dim K m ' n = m • n. 

Alia nomenclatura gia introdotta in [16] sulle matrici, e necessario aggiungere e gene- 
ralizzare alcune definizioni. 

Sia A = (ojj) G K n ' n . Allora si dicono minori principali di A le sottomatrici 

A k = f (aij)i<ij<fe per fc = l,...,n; (1-1-1) 



graficamente, 



A — A n — 



A 



\ 



V A nJ 

Le nozioni di 'matrice triangolare' e 'matrice diagonale' sono estese a matrici rettan- 
golari: se A G K m ' n allora 

1. A e triangolare superiore se = per i > j; 

2. Ah triangolare inferiore se = per i < j; 

3. A e diagonale se = per % ^ j; 

4. A e di Hessenberg superiore se = per i > j + 1; 

5. A e di Hessenberg inferiore se a^- = per j > i + 1; 

6. A e tridiagonale se a^- = per j > i + 1 ed i > j + 1; 

7. A e di permutazione se si ottiene da / con scambi di righe e colonne. 

II vettore (an, . . . , a^), con k = min{m, n}, si dice diagonale principale di A. I vetto- 
ri (a^i+h, . . . , ak,k+h), (ai+h,i, • • • , flfc+h^) 1 si dicono, rispettivamente, h-esima sopradia- 
gonale ed h-esima sottodiagonale. Una matrice tridiagonale ha gli elementi al di fuo- 
ri della diagonale, della prima sopradiagonale e della prima sottodiagonale nulli, ed e 
simultaneamente di Hessenberg superiore ed inferiore. 

Siano n > m, e Ai, . . . , A m G K. Allora la matrice diagonale A = (a^) G K n,m tale che 
aij = se i 7^ j e an = Aj per i = 1, . . . , m si indica con diag(Ai, . . . , A m ). La defmizione 
si ripete banalmente per il caso n < m. 



1 Se c'e possibilita di equivoco, al posto di scriveremo a^j. 
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Esercizio 1.1. SiaT T 



strare che l u 



u 



I'insieme delle matrici triangolari superiori in 



Dimo- 



e un sottospazio vettoriale di K r ' 



trovarne la dimensione ed una base. 



Ripetere V esercizio per I'insieme delle matrici triangolari inferiori T L ' . 

Una matrice A e K n ' n si dice unipotente superiore (inferiore) se e triangolare superiore 
(inferiore) e a„ — 1 per i = 1, . . . , n. 

Esercizio 1.2. Dimostrare che le matrici unipotenti costituiscono un sottogruppo di 
GL(n, K). Dimostrare che non costituiscono un sottospazio vettoriale di K n ' n . 

Osservazione 1.1. Una matrice tridiagonale e detta anche matrice di Jacobi di 
ordine n. Se 

h 

a 2 b 2 
, _ c 2 a 3 

•Jn 



Cl 





\ 





C„-l 



On 



si vede facilmente che 



det J n = a n det J„_i — 6 n _ic n _i det J„_ 2 n > 3. 
Se ai = 1 = 6j, Ci = —1, ponendo det Jk = Fk si ha 

F n = F n _i + F n _ 2 , snccessione di Fibonacci. 
Posto F = 1 = Fi si ottiene la successione 

1,1,2,3,5,8,13,21,... 

Questa e la famosa successione introdotta da Leonardo da Pisa (o Leonardus Pisanus), 
detto anche il Fibonacci, vissuto nel secolo XII; egli ha introdotto in Europa tra il 1100 
ed il 1200 il sistema di numerazione posizionale indiano, a lui pervenuto tramite gli arabi. 
La successione fu introdotta nel Liber Abaci (1202) per risolvere il seguente problema: 

Quante coppie di conigli possono essere prodotti dalla coppia iniziale in 
un anno supponendo che ogni mese ogni coppia produca una nuova coppia in 
grado di riprodursi a sua volta dal secondo mese? 

II matematico francese Binet (1786-1856) scopri una formula, nota gia ad Eulero (1707- 
1783), che permette di calcolare direttamente un qualsiasi numero di Fibonacci: 



dove $ = (1 + y/5)/2 = 1,6180339887. . . e il valore del raggio aureo, che e un numero 
irrazionale, mentre F n e sempre un intero, malgrado l'aspetto della formula precedente. 
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1.2 Norme sulle matrici 

Definizione 1.1. Sia V uno spazio vettoriale su campo K, con K = K o I = C. Si 
dice norma su V un'applicazione 

|| • || : V — > R 

tale che 

1. \\x || > per ogni x G V, e || a?|| = se e solo se x = 0; 

2. ||cx|| = |c|||x|| per ogni i 6 ^, c G I; 

3. \\x + y|| < ||x|| + ||y|| per ogni x, y G V. 

Lo spazio (V, || • ||) si dice spazio normato. Si osservi che uno spazio euclideo (V,g) e 
anche uno spazio normato rispetto alia norma 

\\ x \\g = V9{x,x) 

indotta dal prodotto scalare g. Viceversa, non tutte le norme provengono da un prodotto 
scalare, come si puo dimostrare con esempi. Tuttavia, se vale Videntita del parallelogram- 
ma 

\\x + y\\ 2 + \\x - y\\ 2 = 2(\\x\\ 2 + \\yf), 
si puo definire un prodotto scalare g ponendo 

9{x,y) = ^{\\x + y\\ 2 - \\x\\ 2 - \\y\\ 2 ). 

Si noti che la dimostrazione di quest 'ultima affermazione non e banale. 

Ora, si vogliono introdurre norme sullo spazio vettoriale K m,n . Come e noto, dimK m ' n = 
dimlK mn , quindi K m,ri = K mn . Un particolare isomorfismo, interessante per le applicazio- 
ni, e quello indotto dall'ordine lessicografico 



^11 ' ' ' a In 



h " > • • • , Oln? • • • ; &mli ■ ■ ■ 5 tt mn ). 



Quest 'isomorfismo permette di trasportare su K. m,n molti concetti familiari in K. mn . Ad 
esempio, se g e un prodotto scalare in K mn , si ottiene un prodotto scalare g' su K m ' n 
ponendo 

g'(A,B)^g&(A),v(B))- 
In tal modo viene introdotto in K m ' n un concetto di lunghezza, di misura, di "vicinanza" 
tra matrici, indispensabile nella teoria dell'approssimazione. Cosi, se IK = C e g e l'usuale 
prodotto scalare euclideo, possiamo introdurre in K m ' n una norma per le matrici ponendo 

||A||^= f iy \aij\ 2 norma di Frobenius o euclidea . 
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Invece, per A e K n ' n , la norma 

i/p 



norma L p 



non proviene da un prodotto scalare per p ^ 2. Per p = 1 la norma precedente e detta 
anche norma del tassista, o norma di Manhattan: 

n 

Per p = 2 si ha la norma di Frobenius. 

Per p = oo si definisce la norma del massimo: 

1 1 A 1 1 oo = max | dij | . 

l<i,j<n 

Esercizio 1.3. Definita la circonferenza unitaria in R 2 dotato della norma || • || p come 

S 1 = {x E R 2 | = 1}, 

disegnare S 1 nei casi p = 1 e p = oo. 

Si possono generare molte norme di matrici nel modo seguente. 

Definizione 1.2. Sia || • || una fissata norma in K n , con K = MoK = C. Si definisce 
norma naturale (o norma indotta dalla norma vettoriale || • ||) della matrice A G K n,n il 
numero 

PII| d ='su P W 

IfII 

(che indichiamo con ||| • ||| per distinguerla dalle norme vettoriali). 

Poiche per ogni x ^ si puo definire u — x/||x|| in modo che ||u|| = 1, la definizione 
precedente e equivalente a 

|||^4||| = max 

||u||=l 

Se A = I si ha |||/||| = 1. Inoltre, dalla definizione si ha \\Ax\\ < \\\A \\\ \\x\\. 
Si osservi che la norma di Frobenius non e subordinata ad una norma vettoriale, poiche 
\\I\\f = \fn. 

La norma naturale di A = (a^) indotta da || ■ ||i b 

n 

\\\ A \\\i = max El a *il' 
i=i 

ed e detta brevemente massima somma di colonna di A. 
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La norma naturale di A = (a^) indotta da || • ||oo e 

n 

IPIIU = max K\, 

Ki<n ^— ' 
~ ~ 3=1 

ed e detta brevemente massima somma di riga di A. 

Osservazione 1.2. Ogni norma naturale su C"' n soddisfa la proprieta 

|||AB||| < |p HI IIISIH, (1.2.2) 

detta di submoltiplicativita. 

Non tutte le norme di matrici soddisfano tale proprieta: ad esempio, le matrici 

non soddisfano la proprieta (1.2.2) se si considera || • ||oo- La norma di Frobenius, tutta- 
via, soddisfa la proprieta (1.2.2). Verificare queste affermazioni per esercizio (in caso di 
difflcolta, e possibile trovare queste dimostrazioni in qualsiasi libro di analisi numerica). 
Molti testi, nella definizione di norma di una matrice, richiedono, oltre alle proprieta della 
definizione 1.1, anche la submoltiplicativita, che e utile, come evidenziato nella successiva 
osservazione. □ 

Osservazione 1.3. Se ||| • ||| h una norma di matrice verificante la submoltiplicativita, 
allora esiste una norma vettoriale || • || su C n tale che 

\\AX\\ < |p HI ||X|| \/AeC n ' m , VIgC™' 1 . 

Basta considerare la matrice M avente come prima colonna X e le altre nulle, e porre per 
definizione ||X|| = |||M|||. 

Osservazione 1.4. La definizione 1.2 si estende in modo ovvio al caso di matrici 
rettangolari A e C m,ri valutando \\x\\ con la norma in C n ed \\Ax\\ con quella in C m . □ 

Osservazione 1.5. In (M™' n , g'), dove g' e indotta dall'usuale prodotto scalare in M" -2 , 
l'espressione della disuguaglianza di Schwarz e 

/ \ V2 / \ 1/2 
\g\A,B)\<^{AA)^g^B) =► |^a^|< E4 \T. h l 



i,3 / \ 1,3 



Ponendo B = Id si ha 

1/2 



trA\< [J2 



a % 



1,3 
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da cui la nota disuguaglianza di Newton, utile in Calcolo Numerico, 

1/2 



= E' 



h3 



> -=\tiA\. □ 

In 



1.3 Matrici a blocchi 

In diversi problemi le matrici in considerazione vengono suddivise in blocchi (o sot- 
tomatrici) sia perche certi sottoinsiemi hanno un significato speciale, sia per motivi di 
comodita di calcolo. Infatti, quando si lavora con matrici di grandi dimensioni e impor- 
tante poter riguardare ciascuna matrice come insieme di matrici di dimensioni inferiori. 
Ad esempio, se A e K m ' n si puo scrivere 



fA n A 12 
A21 A22 



A lr \ 

A 2r 



si 



is2 



A sr ) 



dove Aij sono a loro volta matrici. Naturalmente, A a , . . . , A ir hanno lo stesso numero di 
righe, mentre Aij, . . . , A S j hanno lo stesso numero di colonne. 

Esempio 1.1. 



A = 



dove 



/ 1 


2 


-1 





3 


1 \ 





1 


2 


-1 








2 





1 





-1 








4 


-1 











V 3 








1 





/ 














An 


= 




') 


, A 12 = 








0/ 







A = 



A u 
A 2 i 



A 12 
A 23 



A 13 
A 33 



Si osservi che, nel caso di un sistema lineare AX = B, la matrice completa risulta 

essere la matrice a blocchi A — (A: B). 

Se A^ = O per i > j (i < j) allora A e detta matrice triangolare superiore (inferiore) 
a blocchi. 

Se A^ = O per % 7^ j allora A e detta matrice diagonale a blocchi. 

Si dimostra facilmente che la moltiplicazione tra due matrici a blocchi e equivalente ad 
una matrice i cui blocchi sono la moltiplicazione 'righe di blocchi' per 'colonne di blocchi'. 
Supponiamo, infatti, che una matrice A e K m,n sia ripartita nella matrice riga delle sue 
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colonne, o nella matrice colonna delle sue righe: 





Se X G K™' 1 , X = (xi, . . .,x n ) T , risulta AX = x 1 C l H h x n C n . 

Le precedenti considerazioni si generalizzano facilmente al caso di matrici partizionate 
a blocchi di dimensione arbitraria (con il vincolo della moltiplicabilita tra blocchi). 

Proposizione 1.1. Siano A G K m ' n , B G K n ' p matrici partizionate in blocchi Aik G 
K mi,rife ; 5 fej G K nfc ' p J ; dove i = 1, . . . , s, k = 1, . . . , r j = l,...,t. Allora la matrice 
prodotto AB e partizionata nei blocchi (AB)^ G K mi ' P: > , dove 



Sia, ora A G K n ' n . Se M e una sottomatrice quadrata di A si dice minore comple- 
mentare di M il minore M' ottenuto da A togliendo tutte le righe e colonne di A che 
concorrono a formare M. Si chiama cofattore di M l'espressione (— l) SM detM', dove 

sm = ii H 1- ifc + ji H h jfc ed ii, . . . , ifc sono le righe di A che concorrono a formare 

M, ji, . . . , jfc sono le colonne di A che concorrono a formare M. Si noti che queste defi- 
nizioni generalizzano l'ordinaria nozione di minore complementare e cofattore rispetto ad 
un elemento di A. 

Teorema 1.1 (Laplace). Sia A G K. n,n , e si fissino k righe (o colonne) di A. Allora 
det A e uguale alia somma dei prodotti dei determinanti di tutti i minori di ordine k 
estratti da tali righe (o colonne) per i rispettivi cofattori. 

Corollario 1.1. Sia A G K n ' n una matrice triangolare (superiore o inferiore) a 
blocchi, con blocchi diagonali quadrati. Allora si ha 



r 



(AB)ij = A ik B k j. 



k=i 



r 



det A = Yl det A, 



ii 



i=i 



Esempio 1.2. 



• Si consideri la matrice quadrata di ordine n + m cosi defmita 




A G W l ' n B G K n ' m 
O G K m ' n C G K m ' m 
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Allora detM = det AdetC; quindi M e invertibile se e solo se A e C lo sono. In 
tal caso risulta 

*, i -A- l BC~ v 
M = { O 

(suggerimento: si consideri una matrice M' a blocchi e si richieda MM' = I). 
• Si consideri la matrice quadrata di ordine 2n cosi definita 

N= (c d) A,B,C,DeK n ' n . 

In generale, det N ^ det (AD — BC). Ma se D e invertibile si ha 

det N = det(AD - BD~ X CD) : 

infatti 

detAr = detArdet(_/ lc , j)=det((^ [_^ C /) 

da cui il risultato. Inoltre, se CD = DC (ad esempio, se C = XI con A G K) si ha 

detiV = det (AD - BC). 

1.4 Forme canoniche delle matrici 

Come e noto, la matrice di un endomorfismo rispetto ad una base di autovettori 
e diagonale, ma non sempre e possibile ottenere una matrice con un'espressione cosi 
semplice. La teoria delle forme canoniche si occupa della ricerca di basi rispetto alle 
quali la matrice di un endomorfismo assuma forme particolarmente semplici, usualmente 
a blocchi soddisfacenti determinate caratteristiche. 

Per fare questo, invece del concetto, troppo restrittivo, di 'autospazio', si introduce il 
concetto piu generale di 'sottospazio invariante'. 

Sia V uno spazio vettoriale su un campo K, e sia W un suo sottospazio. Si dice che 
W e invariante (o stabile) rispetto ad un endomorfismo /: V — > V se f(W) C W (o, 
equivalentemente, se f\w e un endomorfismo di W). 

Sia dim V — n, dim W = k e B' una base di W. Se B e una base di V ottenuta da £>' 
per completamento, allora 

M B {J) - y c) ' O e K n ~ k ' k C e K n - k ' n - k 
Naturalmente, A — M%(f\w)- 
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Ovviamente, per quanto studiato sugli autovalori, gli autospazi sono sottospazi inva- 
riants rispetto ad /, ma non tutti i sottospazi invarianti sono autospazi rispetto ad un 
qualche autovalore. 

Inoltre, non e detto che V sia decomponibile in somma diretta di sottospazi propri 
invarianti. Se questo succede, la matrice di / rispetto ad una base di vettori dei sottospazi 
invarianti e una matrice diagonale a blocchi. Se, in particolare, V e somma diretta degli 
autospazi (e quindi / e un endomorfismo semplice), allora i blocchi diagonali assumono 
la forma A u = \I, quindi la matrice e diagonale. 

Esempio 1.3. Sia /: M 2 — > M 2 tale che la sua matrice rispetto alia base canonica sia 
^ = (02)- Provare che l'unico sottospazio di dimensione 1 invariante rispetto ad f b 
l'autospazio V(2). 

II seguente teorema assicura l'esistenza di un'ampia classe di endomorfismi che am- 
mettono una matrice triangolare. 

Teorema 1.2. Sia f : V — > V un endomorfismo di uno spazio vettoriale V su campo 
K di dimensione n. Supponiamo che il polinomio caratteristico di f si decomponga in 
fattori di primo grado in IK. Allora esistono n + 1 sottospazi vettoriali V , V\,. . . , V n tali 
che 



La successione di sottospazi Vq C V\ C • • • C V n si dice successione di sottospazi a 
bandiera. Una base 



1 



f{V h ) C V h per h = 0,1,2,..., n; 



2. 



dim Vh = h; 



3. 



{0} = V C V 1 C • • • C V n = V. 



B = {ei 



, . . . , e n } tale che V h = £(e\, ...,e h ) 



e detta base a bandiera. Allora per l'invarianza si ha 



t\2e\ + t 22 e 2 , 



f(e n ) 





\0 ... t nn J 
e una matrice triangolare superiore. Ovviamente gli autovalori di A sono tu. 
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Una matrice A e K. n,n si dice triangolarizzabile 2 se e simile ad una matrice triangolare. 
Allora il teorema precedente si puo formulare nel seguente modo. 

Teorema 1.3. Sia A e K n,n tale che il suo polinomio caratteristico det(A — XI) si 
decomponga in fattori di primo grado in K. Allora A e triangolarizzabile. 

Ovviamente, se K e algebricamente chiuso (come C), il teorema vale per qualsiasi 
matrice in K n ' n . 

Osservazione 1.6. Siano A, A E K n ' n due matrici simili, ovvero A = B~ l AB per 
una certa matrice invertibile B. Allora, se h > si ha 

A h = {B^ABf = B- 1 A h B, 

quindi A h e simile ad A h . In particolare, se A e invertibile e simile ad una matrice 
triangolare A (come nel caso IK = C), risulta 

A" 1 = (B^AB)- 1 = B^A^B, 

cioe A -1 e simile ad A -1 , ma l'inversa di una matrice triangolare si calcola facilmente. Si 
noti che gli autovalori di A h sono le potenze /i-esime degli autovalori di A. □ 

Come vedremo piu avanti, si puo dire di piu sulle matrici su di un campo algebrica- 
mente chiuso. Piu precisamente proveremo il seguente teorema. 

Teorema 1.4. Sia K un campo algebricamente chiuso. Ogni matrice A e K n ' n e 
simile ad una matrice J, detta forma di Jordan 3 di A, avente le seguenti proprieta: 

1. J e triangolare superiore; 

2. lungo la diagonale principale di J compaiono gli autovalori di A ripetuti con la loro 
molteplicita; 

3. gli n — 1 elementi di posizione + 1) (che si trovano 'sopra' la diagonale di J) 
sono uguali aO o ad 1; gli elementi di posizione + s) con s > 1 sono nulli. 

Esempio 1.4. La seguente matrice e in forma di Jordan: 



-2 


1 

















-2 























1 




















1 






































3 



2 Non si confonda questa nozionc con la trangolarizzazione dei sistemi lineari\ 
3 Camillc Jordan (1838-1922) 
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Naturalmente, gli autovalori di J sono —2 con molteplicita algebrica 2, con molteplicita 
algebrica 3 e 3 con molteplicita algebrica 1. 

Si chiama blocco di Jordan di ordine k associato ad un autovalore A di A la matrice 
quadrat a di ordine k del tipo 



Ogni forma di Jordan di una matrice A che ha gli autovalori distinti Ai, . . . , X r ha 
lungo la diagonale principale blocchi di Jordan. 

1.5 Matrici complesse 

Nel caso in cui K = C, alle operazioni che sono state gia introdotte in [16] possono 
essere aggiunte altre operazioni, che verranno descritte in questo paragrafo. 

Poiche il campo C e algebricamente chiuso, ogni matrice quadrata A G C n,n ammette 
la forma canonica di Jordan. Sara dimostrato nel seguito che, nel caso in cui A soddi- 
sfi un'ulteriore ipotesi (che e una generalizzazione al campo complesso della simmetria 
richiesta per le matrici reali), la forma canonica di Jordan diventa diagonale. 

Definizione 1.3. Sia A = (a^) G C rn ' n . Allora si dice 

1. coniugata di A la matrice A = f (a^"); 

2. aggiunta di A la matrice A* = l A T = A T . 

Si dimostrano facilmente le seguenti proprieta: 

1. A** = A 

2. (A + B)* = A* + B*e (XA)* = XA* per A G C; 

3. (AB)* = B*A*; 

4. det A = detA, det A* = det A; 

5. seAe invertibile, (A*)- 1 = (A- 1 )*. 
Definizione 1.4. Sia A = (a^) G C n ' n . Allora A si dice 

1. hermitiana se A* = A; 

2. antihermitiana se A* = —A; 



/X 1 
A 1 



0\ 








A 1 
XJ 
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3. unitaria se AA* = A* A = I; 

4. di fase se A e unitaria e diagonale; 

5. normale se AA* = A* A. 

Si noti che se A e W l ' n C O n , allora A e 
A e unitaria se e solo se A e ortogonale. 

Esercizio 1.4. Dimostrare che 

• A hermitiana =>- an e R, det A e K; 

• A unitaria | det A| = 1; 

provare che non vale I'implicazione opposta. 
Esempio 1.5. 



hermitiana se e solo se A e simmetrica, ed 



• Sia 

(.?, 3 -V) ■ (, _\ 3 -V) . 

dunque A e hermitiana. Essendo det A = —8, A non e unitaria. 

• Se a 6 M, sia 

/e* \ 
^ e- a 7 ' 

Essendo e m = cos a + isina, risulta e a * = e _m , dunque -B = 5*, quindi -B e 
hermitiana se e solo se a = kn, con k G Z. Ma 55* = J, dunque .£> e unitaria. 

Si pone 

U(n, C) ={A E C n ' n | A unitaria} C C n ' n . 

Esercizio 1.5. Provare che U(n,C) e un gruppo rispetto al prodotto di matrici. E 
Vanaloqo del gruppo 0(n, R) del gruppo delle matrici ortogonali. Provare, inoltre, che 
I'insieme delle matrici di fase costituisce un sottogruppo di U(n,C). 

Le matrici unitarie vengono molto usate nell'analisi numerica per trasformare altre 
matrici in modo da lasciare invariata la loro norma, cosi da ridurre l'introduzione di errori 
durante queste trasformazioni. La giustificazione matematica di questa affermazione sta 
nella seguente proposizione. 

Proposizione 1.2. Sia A e C m ' n , e siano P e U(m,C), Q £ U(n,C) matrici 
unitarie. Allora 

\\PA\\ F = \\A\\ F =\\AQ\\ F 
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Dimostrazione. Se A = (Ci, . . . , C n ), dove Cj e la j-esima colonna di A, risulta 

\\PA\\l = \\{PC U ...,pc n )\\l = J2 WPCjWl = £ ||C,||| = » ' " 2 



tenendo conto del fatto che (cfr. Appendice) 

II^-IIf = (PCiYiPCj) = q{p*p)c 3 = \\ca\1. 

Analogamente per l'altra uguaglianza. \sME 
Esercizio 1.6. 

• Provare che \\A\\ F = y/tr (AA*). 

• Provare che se A e un autovalore di A, allora A e un autovalore di A, e quindi di 
A*. 

II teorema 1.3 ammette una formulazione piu specifica per quanto riguarda la base che 
realizza la triangolarizzazione nel caso delle matrici complesse. La proprieta, data senza 
dimostrazione, e espressa dal seguente teorema. 

Teorema di Schur 4 . Sia A e C n ' n . Allora esiste una matrice unitaria U tale che 

U*AU = A, 

ove A e triangolare superiore. 

Dimostrazione. Si usi l'induzione sull'ordine n della matrice. II primo passo e 
banale. Se A e C n,n sia Xi un autovettore di A di modulo I. Si consideri una base 
ortonormale di C n del tipo B = Y 2 , . . . , Y n }. La funzione lineare Ja definita da 
}a{X) = AX assume, nella base B, la forma 



Q*AQ = A' 



Ai B 
O C 



dove Ai e l'autovalore di X 1 e Q e unitaria. Per l'ipotesi induttiva, V*CV = D, dove D 
e triangolare superiore e V e unitaria. Introdotta la matrice unitaria 



Z = 

risulta 



1 O 
O V 



Z*Q*AQZ -- 

da cui la tesi, ponendo U = QZ. \ qed \ 



Ai B' 
O D 



4 Issai Schur (1875-1941) 
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Essendo U* = U 1 , A e simile alia matrice triangolare A, dunque A e A hanno gli 
stessi autovalori. 

Corollario 1.2. Se A E R n ' n C C™' n /ia g/z autovalori reali, allora esiste una 
matrice ortogonale U £ R) teZe c/ie U T AU = A. 

Dal precedente teorema si ottiene una conseguenza fondamentale. 

Teorema spettrale I. Se A £ C n,n e hermitiana, allora esiste una matrice unitaria 
U £ C n ' n te/e c/ie 

= D, 

dove D £ C n ' n e diagonale. 

Dimostrazione. Per il teorema di Schur si ha U*AU = A. Ma 

A* = (U*AU)* = U*A*U = U*AU = A. 

Dunque A e diagonale. WM 

II teorema e detto 'spettrale' poiche fa intervenire lo spettro di una matrice, ossia 
l'insieme dei suoi autovalori. 

II teorema continua a valere per le matrici reali sostituendo le parole "hermitiana" ed 
"unitaria" con "simmetrica" ed "ortogonale", e si riduce al risultato gia noto [16]. Inoltre, 
il teorema vale anche per le matrici unitarie, nella forma seguente. 

Teorema spettrale II. Sia A £ C n ' n . Allora A e normale se e solo se esiste una 
matrice unitaria U £ C n,ri tale che 

U*AU = D, 

dove D £ C n ' n e diagonale. 

Dimostrazione. Sia A = UDU*, e si ponga D = (d^). Allora 

AA* = (UDU*) (UDU*)* = U(DD*)U*, 
A* A = (UDU*)* (UDU*) = U(D*D)U*, 

ma DD* e una matrice diagonale i cui elementi diagonali sono \du\ 2 , da cui la tesi. 
Viceversa, per il teorema di Schur si ha A = U*AU, e da AA* = A* A si ha 

AA* = U*AUU*A*U = U*AA*U = U* A* AU = A*A, 

cioe A e normale. 

Utilizzando l'induzione sull'ordine n della matrice, si dimostra che A e diagonale. II 
primo passo e ovvio. Posto A = (tij), ricordando che A e triangolare superiore, risulta 
per l'elemento di posto (1, 1) in AA* = A*A 

|^ll| 2 + | ^12 1 2 + • • • + | 2 = 1 2 =>• ti2 — • • • — ti n = 0, 
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dunque 

Essendo AA* = A*A, si prova facilmente che anche Ai e normale, dunque diagonale per 
l'ipotesi induttiva. Da questo si ha la tesi. \ qed \ 

II teorema spettrale I nel caso di una matrice simmetrica e detto anche "teorema 
degli assi principali" per le applicazioni che esso ha nella diagonalizzazione delle forme 
quadratiche, e quindi nella ricerca della forma canonica delle quadriche. 

Osservazione 1.7. Gli endomorfismi simmetrici di spazi vettoriali euclidei reali sono 
gli unici che si diagonalizzano con basi ortonormali. Infatti, se /: V — > V e un en- 
domorfismo simmetrico dello spazio vettoriale euclideo V e B e una base ortonormale, 
allora 

M%{f) = U T DU, 

con D diagonale ed U e 0(n,M). Viceversa, se f e diagonalizzabile in R tramite basi 
ortonormali, ossia M.%(f) = U T DU, risulta 

(MS{f)) T =(V T DU) T = MS(f), 

dunque la matrice e simmetrica. □ 
Osservazione 1.8. Ogni matrice quadrata A e C n,n si scompone in modo unico cosi: 

A — H + K, H=-(A + A*), K = -(A-A*), A* = H - K. (1.5.3) 

dove H e hermitiana e K e antihermitiana. Gli autovalori di una matrice hermitiana sono 
reali, gli autovalori di una matrice antihermitiana sono immaginari (verificarlo!). Se si 
fanno corrispondere le matrici hermitiane ai numeri reali e le matrici antihermitiane ai 
numeri immaginari, la scomposizione (1.5.3) corrisponde alia forma algebrica dei numeri 
complessi: z = a + ib. Allora le matrici unitarie possono essere fatte corrispondere ai 
numeri complessi di modulo 1. □ 

1.6 Matrici definite positive 

Definizione 1.5. Una matrice A e C n,ri e definita positiva se e hermitiana e 

X*AX > V X e C™' 1 \ {O}. 

Si confronti la precedente definizione con la teoria sviluppata nel paragrafo A.l. 

Lemma 1.1. Una matrice A e C n ' n hermitiana e definita positiva se e solo se i suoi 
minori principali (definizione (1.1.1)) sono definiti positivi. 



24 



Capitolo 1. Le matrici 



Dimostrazione. Si noti, innanzitutto, die i minori principali di A sono hermitiani 
anch'essi. Per ogni k — 1, . . . , n si puo decomporre A a blocchi come segue: 



A = 



A k P 
Q R 



Sia X e O 1 tale che X = (Y* O)* edY e C k >\ Se Y ^ O, risulta X ^Oe 

X*AX = Y*A k Y, 

da cui la tesi. \ Q ED \ 

Criterio di Sylvester. Una matrice A e C n,n hermitiana e definita positiva se e 
solo se i suoi minori principali (definizione (1.1.1)) soddisfano le condizioni 

det Ak > k = 1, . . . , n. 

Dimostrazione. Usando il precedente lemma, risulta (per induzione) che gli au- 
tovalori di A sono tutti reali positivi, e quindi, poiche A k e diagonalizzabile det A k = 
Ai • • • A fe > 0. \qed\ 

Ovviamente, per k — n il teorema precedente da det A = det A n > 0. 
Esempio 1.6. Sia 




A e simmetrica e A-i — (1), A 2 = (\ 6 2 )> ^3 = A, dunque A e definita positiva. 

Esempio 1.7. Si consideri una funzione /: W l — > K. di classe C 2 e la sua matrice 
liessiana in p 6 1": 

La matrice H(p) e simmetrica reale e da informazioni sui punti critici di /. Piu partico- 
larmente, se p e un punto critico (ossia V/(p) = 0), allora p e detto non degenere quando 
det H (p) 7^ 0. II numero degli autovalori strettamente negativi di H{jp) e detto indice del 
punto critico p di /, ind p (/). Ne segue 

p minimo locale di / <^ ind p (/) = 0, 
p massimo locale di / <^ ind p (/) = n. 

Se < indp(/) < n, il punto peun punto di sella e la forma associata e indefinita. 

Le matrici definite positive intervengono spesso in problemi di ottimizzazione e tro- 
vano molteplici applicazioni nelle scienze e nell'ingegneria. Spesso, infatti, si tratta di 
massimizzare o minimizzare una forma quadratica soggetta a qualche vincolo. II seguente 
teorema e di aiuto in questi casi. 
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Teorema 1.5. Sia A G M n,n simmetrica. Si consideri la forma quadratica Q(X) = 
X T AX . Siano \ m e Am H minimo ed il massimo autovalore di A. Allora: 

1. max{Q(X) | ||X|| < 1} = A M , 

2. min{Q(X) | ||X|| < 1} = A m . 

Inoltre, se X h G C sono gli autovalori di A per h = 1, . . . , n, allora \ h = Q{F h ), dove F h 
e un vettore nell'autospazio V(A/ l ). 

Questo teorema e molto importante nelle applicazioni che coinvolgono problemi di 
vibrazione, dall'aerodinamica alia fisica delle particelle. I valori massimi e minimi descritti 
nel teorema vengono spesso determinati utilizzando tecniche di calcolo in piu variabili. 



1.7 Invertibilita di una matrice 

Sia A E C n ' n . E illustrate un criterio per l'invertibilita di A che non richiede il calcolo 
del determinante, pero la condizione e solo sufficiente. 

Teorema 1.6 (Teorema della diagonale dominante). Sia A e C nn . Condizione 
sufficiente affinche A sia invertibile e che ogni elemento della diagonale abbia modulo 
maggiore della somma degli elementi che si trovano sulla stessa riga, ossia 



da > 



^ ^ I Q>ij \i i 1 , . . . , 71. 



Dimostrazione. Si supponga A non invertibile. Allora esiste V G C n>1 \ {0} tale 
che AV = O. Se Vi e la componente di V con modulo massimo, \vi\ > e 

= (AV)i = anvi H h aaVi H h a in v n 

implica 



Wii\\vi\ = l^aijVjl < ^2\a>ij\\vil 



3=1 3=1 

da cui la tesi. \qeq\ 



Osservazione 1.9. Ovviamente, vale un criterio analogo per le colonne di A. □ 

Osservazione 1.10. Si noti che il calcolo del determinante e molto dispendioso da 
un punto di vista computazionale: occorrono n\ moltiplicazioni di n oggetti ed n som- 
me. II criterio precedente consente di arrivare alle stesse conclusioni (quando possibile!) 
utilizzando solamente n somme di n elementi (una per ogni riga). □ 
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1.8 Diagonalizzazione simultanea di matrici 

Siano A, B, G C n ' n due matrici diagonalizzabili. Ci chiediamo in quali casi sia possibile 
diagonalizzarle simultaneamente, ovvero in quali casi esista una base che sia costituita da 
autovettori sia di A sia di B, e quindi esista una matrice C G C n,n invertibile tale che 

C~ l AC = D, C- X BC = D', 

dove D e D' sono le forme diagonali di A e B rispettivamente. 

Questo problema e molto importante in meccanica quantistica ed in teoria delle 
rappresentazioni. La risposta e data dal seguente teorema. 

Teorema 1.7. Siano A, B,£ C n ' n due matrici diagonalizzabili. Esse sono simulta- 
neamente diagonalizzabili se e solo se sono permutabili. 

Dimostrazione. Se sono simultaneamente diagonalizzabili, allora 

AB = CDC^CD'C- 1 = CDD'C- 1 = CD'DC- 1 = BA. 

Viceversa, supponiamo che A e B siano diagonalizzabili e che AB = BA. Indichiamo con 
V(Ai), . . . , V(A r ) gli autospazi relativi ad A, per cui 

hi = dimV(\i) = rrii. 

dove rrii e la molteplicita algebrica di Aj. Per v G V(Aj) si ha 

A(Bv) = B(Av) = B(Xiv) = \{Bv) =>■ Bv e V(\i), 

quindi l'applicazione lineare associata a B muta ogni sottospazio V(Aj) di A in se. 

Sia ora w un autovettore per B, dunque Bw = piw. Poiche w £ V = V(Ai)©- ■ ■©V r (A r ) 

si ha w = z\ H \-z r , con z*i G V(Aj) per ogni i, in modo unico. Ora, Bw = Bz\ H Bz r 

e Bz,i G V(Aj) per ogni i. Poiche la decomposizione /iw = fiz± + • • • + /iz r e unica si ha 

Bzi = fiZi i = l,...,r. 

Se per un certo indice i si ha z io ^ 0, questo e un autovettore di A poiche z io G V(Aj ), 
ed un autovettore di B poiche Bzi = fiZi . 

Applicando il procedimento indicato sopra ad una base {wi, . . . ,w n } di autovettori 
di B (certo esistente poiche B e diagonalizzabile) otteniamo almeno n vettori che sono 
simultaneamente autovettori di A e B. Poiche i vettori Wi sono combinazione lineare degli 
autovettori simultanei, lo spazio da essi generato e uguale a £(wi, . . . ,w n ) = V; quindi 
da essi si puo estrarre una base. \ qed \ 



Esercizio 1.7. Si considerino le seguenti matrici A e B e si provi che sono simulta- 
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neamente diagonalizzabili. Si determini inoltre una base comune di autovettori 

I 2 0\ / 1 0\ 

A = 2 , B = -2 3 
\-l 3/ \-2 3/ 

SOLUZIONE. Si vede facilmente che AB = BA; si osservi che gli autovalori delle matrici sono gli 
elementi sulla diagonale principale, e che risulta 

V A {2) = £((1, 0, 1), (0, 1, 0)), V A (3) = £((0, 0, 1)), 
V B (3) = £((0, 1,0), (0, 0, 1)), V B (l) = £((1, 1, 1)), 

dunque Ac B sono diagonalizzabili. L'autovettore w — (0,0,1) di B si puo decomporre univocamente 
come w = z\ + z 2l dove z\ <G Va(2) e z 2 G Va(3). In particolare, come e ovvio, w e Va(3). Si consideri 
ora «J = (0, 1, 0); procedendo come prima si ha w € Va(2). Infine, preso uJ = (1, 1, 1), si ha w — z\ + z 2 , 
con z\ — (1, 0, 1) + (0, 1, 0) e z 2 = 0. Dunque la base cercata e 

(0,1,0), (0,0,1), (1,1,1). 

□ 



1.9 Esercizi di riepilogo 

Esercizio 1.8. Sia TQCu(n, K) I'insieme delle matrici triangolari superiori invertibi- 
li in K n,n . Dimostrare che TQCu{n, K) e un sottogruppo di GL(n, K). Ripetere I 'esercizio 
per I'insieme delle matrici triangolari inferiori invertibili. 

(Suggerimento: si dimostri che I'inversa di una matrice triangolare superiore invertibile e triangolare 
superiore e che il prodotto di due matrici triangolari superiori e triangolare superiore.) 

Esercizio 1.9. Siano X, Y e C n . Dimostrare che la matrice XY* ha rango 1. 

(Suggerimento: per ogm Z G C™ si ha (XY*)Z = X(Y*Z).) 

Esercizio 1.10. Siano X, Y e C n . Dimostrare che la matrice XY* ha traccia Y*X . 
Esercizio 1.11. Siano X, Y e C™. Dimostrare che 

1. det(/ + Xr*) = 1 + F*X; 

se 1 + F*X ^ 0, a//ora 

XY* 

(/ + xy*)- 1=r 



1 + F*X 



(Suggerimento: osservato che 

I 0\ f I -X\ _ (I -X 
-Y* i)[y* 1 ) ~ \0 l + Y*X 

applicare il teorema di Binet.) 

Esercizio 1.12. Sia A e C n ' n con detA ^ 0, e siano X, Y e C n . Dimostrare che: 
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1. det(A + XY*) = se e solo se Y*A~ X X = -1; 

2. se det(A + XY*) ^ 0, allora vale la seguente formula di Sherman-Morrison: 

(A + XY*)' 1 = A' 1 - A X) 1 



1 + Y*A~ 1 X' 

(Suggerimento: si usi I'esercizio precedente.ale) 

Esercizio 1.13. Dimostrare che le matrici hermitiane costituiscono un sottospazio 
vettoriale reale di C n,n ma non un sottospazio complesso. Trovarne la dimensione. 

Esercizio 1.14. Provare che, se A e C n,n e invertibile, allora A non pud essere 
nilpotente. 

Esercizio 1.15. Provare che se A e M. n,n e simmetrica e nilpotente, allora A = O. 

Esercizio 1.16. Determinare tutte le matrici A e M 2,2 tali che A 2 = O. 

Esercizio 1.17. Sfruttando I'esercizio precedente, risulvere la seguente equazione ma- 
triciale con incognita X e M, 2,2 : 



X 2 - 2X + I = O. 



SOLUZIONE. 



X = ^ , Vz e R; X = ^ * j , Vy e R 
X = f 1 " ft , V/isR, Vfc e M \ {0}. 



□ 



Esercizio 1.18. Posto 



provare che la matrice 



1 ° ) J=f° 1 
17' 1-1 



1 — t 2 It 
R{t) = —-J+^-J 
w 1 + 1 2 1+t 2 



rappresenta, per ogni t 6l, una rotazione, e determinarne Vangolo <p(t). 

Esercizio 1.19. Se A, B E C n,n , allora AB e BA hanno gli stessi autovalori. 

(Suggerimento: se X — e un autovalore di AB, allora = det(A_B) = dct(_B^4), quindi A e un 
autovalore di BA. Se A ^ e un autovalore di AB, esiste un vettore X ^ O per cui ABX = XX , 
allora BX / e A e im autovalore per BA. Si noti che in questo caso le matrici possono essere non 
simili: ad esempio si consideri 



1 R _ 1 
0/' 



si ha AB = ma BA ^ O.) 
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Esercizio 1.20. Stabilire per quali eventuali valori dei parametri a, b, c, d G C sono 
simili le matrici 

'1 -1 + V 
i —i —i 
-1 1 l + i 

SOLUZIONE. Condizione necessaria (ma non sufficicnte) affinche B e B 1 siano simili e che -Pb(A) 
P B '(X). Ora 

Pb(A) = (a - X)(i — X)(d - A) = => X = a,i,d, 
Pb'(A) = A(A-i)(A-2 + i) = A = 0,i,2-i, 





/ a 


1 










i 


c 


|. 














quindi a = 0, d = 2 — i, oppure a = 2 — i, d = 0. In entrambi i casi B e B' hanno autovalori distinti, c 
quindi sono diagonalizzabili e simili alia matricc I = diag(0, i, 2 — i), c dunque simili tra loro. □ 



CAPITOLO 2 



FUNZIONI MATRICIALI 



2.1 Polinomi matriciali 

Sia / : R — > R una funzione reale di una variabile reale. Si cerchera di dare significato 
all'espressione f(X) quando X e una matrice. 

Si consideri dapprima il caso in cui / sia un polinomio del tipo 

p(x) = a n x n + a n -\x n ~ x H V a\x + a . 

Se A G R m ' m si pone 

p(A) =a n A n + a n _iA n_1 + • • • + a x A + a J G R m ' m . 

Esempio 2.1. Sia p(x) =x 3 -7x + leA = (J|). Allora A 2 = (Jf), A 3 = (J^ 4 ), 
ep(A) = (- 5 _° 5 ) =-5/. ' " □ 

Si osservi che p : R m ' m — > R m > m non e un endomorfismo, mentre a p(A) si puo associare 
1 'endomorfismo 

f p(A y. R m ^R m , x^p(A)x. 

Se A = diag(Ai, . . . , A m ) e una matrice diagonale, allora A h = diag(Aj" , . . . , A^) e 
p(A) = diag(p(Ai), . . . ,p(A m )). Quindi, in questo caso, se Aj sono radici di p(x) = 0, allora 
p(A) = O. Nel caso di matrici non diagonali, invece, le cose si complicano notevolmente. 

Esempio 2.2. Sia 

p(x) = x 2 = 0. 

Nei numeri reali l'unica soluzione ex = 0. Se X = \ ), l'equazione p(X) = O ammette 
infinite soluzioni, poiche esistono divisori dello 0. 

Ad esempio, si verifica che X-y = (fj{j), X 2 = (P er °§ n i z e -^3 = (oo) 

(per ogni y G R), ed X 4 = ( ~ k h ~ h J k ) (per h G R e k ^ 0) sono soluzioni, diverse da 0, 
dell'equazione p(X) = O 
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2.2 Polinomi annullatori 

Data una matrice A, si ricercano polinomi a coefficienti in un campo IK che si annullino 
in A. Tali polinomi si dicono annullatori di A. 

Lemma 2.1. Esistono polinomi annullatori di A. 

Dimostrazione. Sia A e M n,n , e si considerino le potenze I, A,A 2 ,..., A n2 . Queste 
n 2 + 1 matrici sono dipendenti poiche dimlR n ' n = n 2 ; allora esiste una loro combinazione 
lineare a coefficienti non tutti nulli che da la matrice nulla 

a n 2A n2 + a^^A' 1 '- 1 H h a x A + a I = O. 

Un polinomio annullatore di A (di grado < n 2 )e quindi 

2 2 i 

p(x) = a n 2X n + a n 2_ix n ~ + • • • + a\x + a^. 

\qed\ 

Sia A una matrice simile ad una matrice diagonale D. Allora 

A = B^DB A fe = B~ 1 D k B, 

quindi se p(x) e un polinomio si ha 

p(A) = B~^p(D)B. 

Considerando il polinomio caratteristico Pa(x) di A, risulta 

P A {A) = B- l P A {D)B = B- 1 P D {D)B = O, 

poiche D = diag(Ai, . . . , A n ), dove A, sono gli autovalori di A (e di D). 

Cio che e sorprendente e che il risultato precedente vale per ogni matrice A, anche non 
diagonalizzabile. Per il teorema di Schur, basterebbe dimostrarlo per matrici triangolari. 

Teorema 2.1 (Cayley-Hamilton). Ogni matrice A e K n,n e radice del suo polino- 
mio caratteristico. 

Saranno ora analizzate alcune conseguenze del teorema di Cayley-Hamilton. Innan- 
zitutto, il polinomio caratteristico ha coefficienti determinati da A. Infatti 



P A (X) = det(A - XI) = (-l) n \ n + (-l^&n-iA"- 1 + • • • + (-l)6iA + b , 
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dove 



6 n _i = tr A — an H h a nn , 



b n -2= J2 

l<i<j<n 



dji djj 



bn-3 = 

l<i<j<k<n 



^ij &ik 
Q>ji &jj Qjk 
&ki dkj a kk 



b = det A. 

Se bo = det A ^ 0, poiche per il teorema di Cayley-Hamilton si ha Pa{A) = O, risulta 
A~ 1 P A (A) = (-l)VT- 1 + (-l) B - 1 ft B _ 1 A n - 2 + • • • + + boA^ 1 = O, 

da cui 

A' 1 = 1 ( (-l)"- 1 ^" 1 + (-l) n - 2 6 n _!A n - 2 + • • • + (-l)M + 61/) , 

ossia e possibile trovare A^ 1 come polinomio di grado n — 1 della matrice A. 
Esercizio 2.1. Trovare la matrice inversa di 




SOLUZIONE. A e invertibile perche det A = -2 ^ 0. Si ha 

Pa (A) = det(^ - A/) = -A 3 + 4A 2 - 5A - 2, 
dunque A" 1 = -l/2(^ 2 - AA + 57). 



□ 



Esercizio 2.2. Calcolare, tramite il teorema di Cayley-Hamilton, I'espressione A 4 - 
11 A 2 + 22A (usando la matrice A dell 'esercizio precedente) . 

SOLUZIONE. Da P A (A) = O segue A 3 = AA 2 — 5A — 21. Allora 

A A - 11A 2 + 22A = AA 3 - 11A 2 + 22A = A(AA 2 -5A- 21) - 11A 2 + 22A = 

= AA 3 - 1QA 2 + 20A = A(AA 2 -5A- 21) - IQA 2 + 2QA = -81. 

□ 

Osservazione 2.1. Dunque, per calcolare le potenze A k , con k > n, basta conoscere 
il polinomio caratteristico di A e le potenze A 2 ,. . . A n ~ x (senza calcolare gli autovalori). 



2.3. Polinomio minimo 
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2.3 Polinomio minimo 

II lemma 2.1 assicura l'esistenza di un polinomio annulatore di A di grado minore od 
uguale a n 2 , mentre il teorema di Cayley-Hamilton abbassa il grado ad n. II seguente 
teorema prova die il grado potrebbe ulteriormente abbassarsi. 

Teorema 2.2. Sia A e K n ' n . Allora esiste un solo polinomio //a(A), detto polinomio 
minimo di A, tale che: 

1. /iyi(A) e monico (doe, il coefficiente del termine di grado massimo e uguale ad 1); 

2. pL A (A) = O; 

3. se p(\) e un polinomio tale che p(A) = O allora grp(A) > gr/i^(A). 

Corollario 2.1. Sia A e K n ' n . II polinomio /^a(A) e un fattore di Pa (A). 

Dimostrazione. Infatti, si ha Pa (A) = /i j4 (A)s(A) + r(A), con grr(A) < gr / u j4 (A). 
Poiche risulta 

O = P A {A) = n A (A)s(A) + r(A) = r(A), 
segue che r(A) = per la minimalita di //^(A). 5H1 

Teorema 2.3. I polinomi Pa (A) e /xa(A) hanno gli stessi zeri. 

Dimostrazione. Poiche Pa(A) = /^a(A)s(A), ne segue che gli zeri di /^a(A) devono 
essere zeri di Pa(A). Viceversa, ogni zero di Pa(A) e uno zero di //a(A). Infatti, se A e 
uno zero di Pa (A), allora 

AX = XX =>■ A fc X = A fc X ^ /iA^)X = //a(A)^, 

ma /^a(^4) = O, dunque //a(A) = 0. 5H] 

Ma /xa(A) e monico, quindi 

/ iA(A) = (A-A 1 r---(A-A r )^, 

dove Ai,...,A r sono gli r autovalori distinti di A e X][=i n « — n - Ovviamente, se la 
matrice A ha gli autovalori distinti, risulta Pa (A) = (— 1)"//a(A). 
Infine, si prova il seguente teorema. 

Teorema 2.4. Una matrice A G K"' n e diagonalizzabile in K. se e solo se le radici di 
A*a(A) = sono in K ed hanno molteplicita algebrica 1 (ossia sono n radici distinte). 

Osservazione 2.2. Da quanto sopra detto segue che anche l'espressione di A" 1 come 
polinomio in A di grado minore di n non e unica. Infatti si possono ripetere per /xa(A) le 
stesse argomentazioni fatte per Pa (A) (anche per il calcolo delle potenze di A). 
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Esempio 2.3. Sia 

/l 1 1\ 
10 
"0010 
\0 2/ 

-Pa(A) = (A — 1) 3 (A — 2). Si verifica facilmente che A annulla anche il polinomio (A — 
1) 2 (A — 2), mentre non anulla il polinomio (A — 1)(A — 2). Dunque 

^(A) = (A-l) 2 (A-2). 

Poiche la molteplicita algebrica di 1 rispetto a //a(A) e 2, la matrice A non e diagonaliz- 
zabile. □ 

II teorema 2.4 da un criterio puramente algebrico per la diagonalizzabilita di una 
matrice A, ma bisogna trovare ha (A). Esiste un algoritmo per il calcolo del polinomio 
minimo che non richiede il calcolo esplicito degli autovalori. 



2.4 Funzioni di matrici definite mediante serie di 
potenze 

Sia / : U cC^C una funzione analitica della variabile z 

oo 

f( z ) = Y,akZ k , 

k=0 

e sia p il raggio di convergenza della serie. Se X = (x^) G C n ' n si ha la serie formale 

oo 

J2*kX k . (2.4.1) 

k=0 

Se tale serie converge, il suo limite si indichera f(X). Ebbene 

Teorema 2.5. Condizione sufficiente per Vassoluta convergenza della serie (2.4-1) e 
che la matrice X sia nilpotente o che tutti gli autovalori di X siano in modulo minori di 

P- 

Naturalmente, se p e infmito, e ben definita f(A) per ogni A. 

Osservazione 2.3. Se A = B^AB, allora A k = B~ 1 A k B e f\A) = B~ 1 f(A)B. 
Quindi se A = diag(di, . . . , d n ), risulta /(A) = diag(/(di), . . . , f(d n )) ed f(A) si calcola 
facilmente. 

Definizione 2.1. La funzione e : C n ' n — > C n ' n definita da 



2.4. Funzioni di matrici definite mediante serie di potenze 
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e detta esponenziale di A. 

Si noti inoltre die A k per k > n, grazie al teorema di Cayley-Hamilton, e esprimibile 
come combinazione lineare delle potenze A h con h < n. Naturalmente, se A e una matrice 
nilpotente di ordine h, quindi A h = O, allora 



h-l 



k=0 



Poiche la serie e A e rapidamente convergente, il metodo della serie e quello che viene 
comunemente usato per il calcolo di e A con il computer. 

Analogamente, si defmiscono il seno ed il coseno di una qualsiasi matrice A: 



sin 



00 ( —-\\k 
A= f ^2 a^+i 



k=0 

00 



(2k + 1)1 



cos 



fc=0 



(-1)* 

(2*)! 



|2fe 



mentre, se tutti gli autovalori A/j di A soddisfano alia limitazione \\h\ < 1, si puo definire 

00 



k=0 



Esempio 2.4. 

• Sia A = diag(Ai, . . . , A n ). Allora A k = diag(A^, . . . , A*), quindi 



e A = diag(e Al , . . . ,e An ). 



SiaA = *(Jl). Allora A fc = t fc (^) e 

00 

sin A = 



k=0 



(2k + l)\ V° 



ft 


2k + l\ 


( sint 


t cos A 






= V 


sint / 



Sia A = (° J). Allora A 2 = / e si ha 



/cosht sinh£ N 
ysinht coshty ' 



Si noti che, se 
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allora, come si vede facilmente, 



( e tA, 



\ 



?tA 2 



,tA, 



2.5 Proprieta dell'esponenziale di matrici 

In questo paragrafo saranno esposte alcune proprieta deU'esponenziale di matrici, 
molto utili per le applicazioni. 

Proposizione 2.1. Siano A, B e C n ' n . Allora: 

1. se AB = BA, si ha e A+B = e A e B ; 

2. (e A )- 1 = e - A ; 

3. det(e A ) = e trA , 

quindi e A e sempre una matrice invertibile. 

Dimostrazione. Poiche AB = BA, vale la seguente identita: 

k 



r=0 ^ ' 



da cui la conclusione (1) eseguendo il prodotto delle serie assolutamente convergenti e A 
ed e B . II secondo punto e banale, osservando die e° = I. Per il terzo punto, osservando 
die A e simile ad una matrice triangolare A, risulta 



B- l e A B e det(e y 



det(e A ). 



Pertanto bisogna dimostrare la proprieta solo per il caso delle matrici triangolari. Questo 
compito e lasciato al lettore. 



\QED\ 



l/y/2 l/V2\ 
1/V2 -1/V2J' 



Esempio 2.5. Sia A = ( ? J). Essa e diagonalizzabile ed A = BDB 1 , dove 
D=(l °.V B 

Dunque 

e A = Be D B- 1 = 
Infine det(e A ) = 1, essendo e trA = e° = 1. 



l/y/2 1/V2 \ fe 
l/y/2 -I/V2) [0 e" 1 



l/y/2 1/V2 \ _ /coshl sinhl 
l/y/2 -l/y/2) ~ Vsinhl coshl 



2.6. Esponenziale di matrici ed equazioni differenziali 
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Esercizio 2.3. Provare che seveun autovettore di A relativo all'autovalore X, allora 
v e anche autovettore della matrice e A relativo all'autovalore e x . 



2.6 Esponenziale di matrici ed equazioni differen- 
ziali 

Dati A e C n ' n e C e O 1 , si consideri la funzione 

X:R^C n , X{t)=e At C. 

Sele derivabile, si ha 

^ = Ae At C = AX. 
dt 

Pertanto, dato il sistema di equazioni differenziali ordinarie del primo ordine 

un modo compatto per scrivere le soluzioni del sistema e 

X(t) = e At C, 

con C G C n costante. 

L 'esponenziale di una matrice interviene in modo essenziale nello studio dei sistemi 
di equazioni differenziali ordinarie a coefficienti costanti. Questi sistemi schematizzano 
l'evoluzione di un sistema autonomo (ossia, non dipendente dal tempo in modo esplicito), 
ed i problemi di stabilita delle loro soluzioni hanno particolare importanza nel campo 
dell'Ingegneria, per esempio nell'Automatica [31]. 

Osservazione 2.4. Nei problemi di stabilita per le soluzioni dei sistemi di equazioni 
differenziali lineari a coefficienti costanti e importante avere un criterio che stabilisca sotto 
quali ipotesi sugli autovalori di A risulti 

lim e tA = 0. 

Sussiste, in proposito, il seguente teorema: se tutti gli autovalori di A hanno la parte 
reale negativa, allora e verificata la precedente relazione. In tal caso la matrice A si dice 
stabile. 

Esercizio 2.4. Dare la soluzione generale, in forma compatta, del sistema di equa- 
zioni differenziali lineari 

dx dy 

-dl =x + 2y > Tt =2x + y - 

( Suggerimento: si tratta di calcolare e tA dove A = (21)- Poiche A e diagonalizzabile, il calcolo non 
presenta difficolta. 
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Posto C T — (ci c 2 ) si ha 

x(t) = (ci + c 2 )e 3t + (ci - c 2 )e~ t = k x e 3t + k 2 e~ t 
y(t) = (ci + c 2 )e 3t + (c 2 - ci)e"* = fc ie 3t - fc 2 e"* 

doi)e fci e /c 2 soko costanti. Eliminando il parametro t si ottiene 

(x + y){x — y) 3 = 16fci/c| = costante. 

Le orbite sono curve algebriche di ordine 4 aventi per asintoto le rette x — ±y. L'origine e un punto 
singolare di equilibrio instabile. Si provi a disegnare la precedente famiglia di curve usando un programma 
di calcolo numerico o simbolico.) 



CAPITOLO 3 

LA FORMA CANONICA DI JORDAN 



Sia / : V — > V un endomorfismo di uno spazio vettoriale di dimensione Anita n su un 
campo K. Supponiamo che IK contenga tutti gli zeri del polinomio caratteristico -P/(A) 
di /, cioe -P/(A) sia completamente riducibile in K (nel prodotto di fattori lineari). 

Sappiamo gia che non tutti gli endomorfismi ammettono una forma diagonale, che 
possiamo considerare la piu semplice per rappresentare un endomorfismo rispetto ad una 
base. 

Vogliamo trovare una forma canonica che piu si avvicini a quella diagonale e che 
coincida con essa quando / e semplice. Cio e realizzato dalla cosiddetta forma canonica 
di Jordan. 

Infatti, sempre nell'ipotesi in cui K contenga tutti gli zeri del polinomio caratteristico 
di /, si dimostra che esiste una base opportuna B di V, detta base di Jordan, rispetto cui 
si ha 

M%(f) = D + N, 

dove D e una matrice diagonale, N e una matrice nilpotente (cioe tale che esiste k G N 
tale che N k = O) ed inoltre DN = ND. 

Dunque, ogni matrice quadrata nel campo complesso e simile ad una matrice del tipo 
D + N; mentre nel campo reale una matrice A e simile ad una matrice in forma canonica 
di Jordan se e solo se il polinomio caratteristico di A ha tutte le radici reali. 

Naturalmente, se f e semplice allora N = O e si ritorna a quanto noto. Piu precisa- 
mente sia 

P / (A) = (-l) n (A - AO™ 1 • • • (A - \ r ) mr 

dove Ai, . . . , A r sono gli zeri distinti del polinomio caratteristico ed m 8 e la molteplicita 
algebrica di Aj. Naturalmente YH=i m i = n - 

Nel caso piu generale in una base di Jordan si ha 





fJi 


.. 


■ °\ 


J = M B B {f) = 





J 2 ■■ 
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dove hi = dimV(Xi). Ogni blocco elementare di ordine kf 1 tale che 1 < k\ 3> < mi e 
dato da 



Si) 



J 



(?) <M 



/ \i 1 
Aj 1 



A, 








\0 



Ai 1 
o \J 



/0 1 ... 0\ 
1 ... 



Aj/ + Nj, con iV, 



La matrice Nj e nilpotente di indice k\^ ed ovviamente commuta con Aj/. Ovviamente 
iVj ha come autovalore con molteplicita k!f \ La matrice Nj e detta blocco nilpotente di 
ordine k^\ 

Si noti che i blocchi elementari di solito vengono scritti secondo l'ordine decrescente. 
Se / e semplice, allora J^} = (Aj) G K 1 ' 1 . 

Da quanto precede si deduce facilmente come dovra essere una base di Jordan. Sia A« 
un autovalore di / di molteplicita algebrica m^. Una catena di Jordan per / di lunghezza 



dcf 




\0 



1 
0/ 



k^\ con 1 < kf < rrii, e un insieme di vettori 



Si) 



{v^\h=l,...,kf} tale che f = ^> + v^, h = l,...,k?>, 



Si) 



.0) 



dove e stato posto v = 0, quindi fiv^) = Xivf 1 . 

Una base di Jordan per / e una base di V composta dall'unione di un certo numero 
di catene di Jordan per / a due a due disgiunte. Una base di autovettori e una base di 
Jordan composta di catene di Jordan di lunghezza 1. E ovvio che il concetto di base di 
Jordan generalizza quello di base di autovettori. 

Esempio 3.1. Si consideri la matrice 



A = 



Si ha Ai = con mi = 4, dunque r — 1. Dal calcolo si ottiene dimU(0) = 2, dunque i 
blocchi elementari sono 2. Ovviamente A non e diagonalizzabile. Per stabilire la dimen- 
sione dei blocchi di Jordan (che potrebbero essere entrambi di ordine 2, o di ordine 1 e 
di ordine 3) bisogna studiare la forma canonica degli endomorfismi nilpotenti, essendo la 
nostra matrice nilpotente. Infatti 



/o 


1 





2 \ 

















3 





-1 










0/ 



Pa(X) = X 4 



O = P A {A) = A 4 



Esercizio 3.1. Provare che una matrice A e nilpotente se e solo se ha come unico 
autovalore A = 0. 



3.1. Gli endomorfismi nilpotenti e la loro forma canonica 
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3.1 Gli endomorfismi nilpotenti e la loro forma ca- 
nonica 

Sia t: V — > V un endomorfismo nilpotente di indice k. Allora si ha 

Kert C Kert 2 C • • • C Kert fc = V 

e tutte le inclusioni sono proprie se t ^ 0. Infatti, per qualunque endomorfismo (anche 
non nilpotente), si ha Kert h C Kert h+1 ; se per un certo h < k risultasse Kert' 1 = Kert h+1 , 
allora si avrebbe anche • • -Kert h+2 C Keit h+1 = Kert h (come e facile verificare), il che 
implicherebbe V = Kert h , contraddicendo l'ipotesi che l'indice di t sia k. 

Teorema 3.1. Sia t: V — > V un endomorfismo nilpotente di indice k di uno spazio 
vettoriale V di dimensione n su campo IK. Allora t si pud rappresentare con una matrice 
nilpotente a blocchi del tipo standard Nj. 

Dimostrazione. La dimostrazione e di tipo costruttivo; si tratta di trovare una base 
rispetto alia quale t assume la forma richiesta. 

Passo 1. Siano Vi, . . . ,v Pl vettori indipendenti in V \ Kert fc_1 che costituiscono una 
base del supplementare di Kert fc_1 in V. Allora {t(vi), . . . ,t(v Pl )} C Kert fc_1 e si vede che 
una qualunque combinazione lineare a coefficienti non nulli di tali vettori non appartiene 
a Kert k ~ 2 . Dunque 

{t(vi),...,t(v pi )} C Ker^" 1 \Kert fc - 2 ; 

inoltre tali vettori sono indipendenti. 

Passo 2. Sia {t(vi), . . . , t(v Pl ),v Pl+ i, . . . , v P2 ) una base di un supplementare di Ker t k ~ 2 
in Keri fe_1 . Ragionando come sopra si prova che 

{t 2 ^), . . .,t 2 (v n ),t(v Pl+ i), t(v P2 )} C Kert fe - 2 \ Keit^ 3 ; 

inoltre, tali vettori sono indipendenti. 
Passo k — 1 . Si ottiene la base di Ker t 

{t fc-1 (ui), • • • , t k ~\v Pl ), t k - 2 (v Pl+1 ), tivp^), v Pk _ 1+ i, ...,v Pk }. 

Verra ora dimostrato che un riordinamento di tutti i vettori sopra considerati fornisce 
la base di Jordan cercata. Posto = dim(Kert fe ), risulta 

Pi = n k - n k _i —n — n k -i 
P2 = n k _i - n fc _ 2 > Pi 
< ■■■ 

Pk-i = n 2 -n 1 > p k _i 
k Pk = ni> p k -i 
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Si consideri la seguente base di V: 



Pk — Pk-i riglie di vettori: 



p 2 — Pi righe di vettori: 



Pi righe di vettori: 




t k 2 {v P2 ),t k 3 ({T P2 ),...,t(V P2 ),y; 



t k \v Pl ),t k 2 {v pi ),...,t{v pi ),v pi 
t k ~ 2 (v Pl +i),t k ~ 3 (v Pl+1 ), . . .,t(v Pl+1 ),v Pl+1 



Pk 



Vfc-i+i 



P2 



Seweun vettore di questa base, allora t(w) G Kert 1 \ Kert 1-1 per un solo valore di % 
tale che 1 < i < k. Dunque, ogni riga costituita da i vettori produce un blocco nilpotente 
Ni nella matrice di t. Piu in dettaglio, risultano 

Pi blocchi di ordine k, 



Dunque, il totale dei blocchi nilpotenti e 

Pi + (j>2 — Pi) H h (pk ~ Pk-i) =Pk = ni = dim(Kert), 

ed il numero dei vettori della base e 

Pik + (p 2 ~Pi)(k — 1) H h (p k - Pk-i) = Pi +P2 H \~Pk = n k = n = dimV. 

La matrice di t rispetto a questa base e 

(N, \ 

N 2 



Si noti che il numero dei blocchi nilpotenti di ordine k — I e 

Pi+i - Pi = nk-(i+i)+i - nk-(i+i) - nk-i+i + n k _i = 2n k _i - n k ^_ x - n k _ l+1 ; 
ovvero, il numero dei blocchi nilpotenti di ordine i = k — I e 



P2 — Pi blocchi di ordine k — 1, 



Pk — Pk~i blocchi di ordine 1. 



V 



NnJ 



\QED 



2rii - rii-i - n i+ i, 



3.1. Gli endomorfismi nilpotenti e la loro forma canonica 
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posto rii = n per % > k ed n« = per i < 0. 

Esempio 3.2. Si consideri t: M 5 — ► M 5 rappresentato rispetto alia base canonica da 



A = 



/-5 -5 2 0\ 

5 5 -2 

1 



\ 5 5 0/ 



Risulta A 2 = O, dunque A ha indice 2, quindi 

{0} C Kert C Kert 2 = V. 
Essendo Kert = {(x±, — x±, x 3 , 0, x 5 ) \ Xi,x 3 , x 5 G R}, si ha 



ni = dim Kert = 3 
p 1 = n 2 -n 1 = 2 



ri2 = dim Ker t 2 = 5 
p 2 = ni = 3 



Si considerino due vettori indipendenti in V \ Kert, ad esempio 

i?i = (0,0, 0,1,0), v 2 = (1,1,0,0,0). 

Si ha 

t(^) = (2, -2, 1, 0, 0), t(v 2 ) = (-10, 10, 0, 0, 10). 

Siccome {t(v\), t(v 2 )} C Kert, si complementa questo insieme ad una base di Kert 
mediante, ad esempio, il vettore {7 3 = (0, 0, 1, 0, 0). La base cercata e 

Rispetto a questa base, t ha la matrice 



J 



(° 


i 


io 
















!o 

i ■ ■ ■ - 
















;0 


1 













|0 
























) 



Ovviamente, J e simile ad A, e risulta J 2 = O. 

I blocchi di ordine 2 sono 2n 2 — n\ — n 3 = n 2 
c'e un solo blocco di ordine 1. 



— ri\ = 2, ed analogamente si vede che 
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3.2 Endomorfismi con un solo autovalore 

Sia 

P f (X) = (-1)"(A - Ai) n 
il polinomio caratteristico di /. Dal teorema di Cayley-Hamilton si ha 

P f (A) = P f (f) = =► (f-X 1 Id) n = Q. 

Quindi t — f — Ai Id e nilpotente con indice di nilpotenza uguale a, k <n. Sia £> la base 
rispetto alia quale t e rappresentato dalla matrice N a blocchi nilpotenti, allora 

M%(f)=M%(t + \ 1 Id) = N + \ 1 I, 

che e la forma di Jordan di /. 

3.3 Endomorfismi con piu autovalori 

Supponiamo che 1'endomorfismo / abbia piu autovalori distinti, ma, in ogni caso, che 
il suo polinomio caratteristico si decomponga in fattori lineari. 

p f (\) = (-l) n (A - Ai) mi • • • (A - X r ) mr . 

Definizione 3.1. Si dice autospazio generalizzato per / il sottospazio di V 

^(AO^KerCf-Aild)"*. 

Ovviamente, per rrii — 1 (ma non solo in questo caso) l'autospazio generalizzato e 
anche un autospazio nel senso usuale del termine. 

Si vede facilmente che E(Xi) e un sottospazio invariante rispetto ad / ed inoltre 

dimE(Ai) = mi, V = E(X 1 ) © ■ ■ ■ © E(X r ). 

Posto 

fi risulta essere un endomorfismo con un solo autovalore A«. Quindi 

fi = ti + Aj Id = ti + 

avendo posto Sj = f Aj Id: E(Xi) — > E(Xi) e U = f /— A, Id. L'endomorfismo Sj e un endomor- 
fismo semplice con il solo autovalore Aj, l'endomorfismo e un endomorfismo nilpotente 
con indice ^ < mj. E possibile estendere gli endomorfismi fi, ti, s, ad endomorfismi dello 
spazio V definendo fi, ti, Sj come le applicazioni nulle sui sottospazi E(Xj), per j ^ i. 
Risulta 

/ = fl + • ■ • + fr = (il + • • • + U) + (Si + • • • + S r ) = t + S, 



3.3. Endomorfismi con piii autovalori 
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avendo posto t = t\ + • • • + t r ed s = s\ + ■ ■ ■ + s r . Si osservi che ts = st. 

Si scelga ora come base B di V l'unione delle basi dei sottospazi E(\i) rispetto a cui 
ogni fi assume la forma canonica di Jordan. Rispetto alia base B, f e rappresentato 
nella forma canonica di Jordan e la sua matrice e costituita da r blocchi disposti lungo la 
diagonale di ordine mi, . . . ,m r relativi agli autovalori Ai, . . . , A r ognuno dei quali contiene 
almeno un blocco elementare di ordine ki, . . . ,k r . 

Osservazione 3.1. 

1. Si ha V(\i) C E(\i) per ogni i, ed / e semplice se e solo se V(Aj) = E(\i). In tal 
caso, infatti, la molteplicita algebrica coincide con quella geometrica. Inoltre, per 
ogni i risulta fi — \ Id, U — e ki — 1. 

2. Se / e un endomorfismo di uno spazio vettoriale complesso rappresentato da una 
matrice A e M n ' n , la sua forma canonica di Jordan conterra elementi complessi. 
Tuttavia esiste una rappresentazione mediante una matrice ad elementi reali detta 
forma di Jordan reale. Questa si ottiene considerando che gli autovalori complessi 
sono presenti a coppie coniugate, dunque se z — u + iv e un autovettore relativo 
all'autovalore A = a + ib, il vettore z = u — iv e un autovettore relativo all'autovalore 
A = a — ib. Pertanto, anziche utilizzare i vettori z e z, si utilizzeranno i vettori 

u = Re(z), v = lm(z). 

3. Sia /: V — > V e sia A = M.%(f) la matrice di / rispetto ad una base B di V . Se B' 
e una base di Jordan, allora 

M%{f)=D + N =>• A = B~ 1 {D + N)B = B~ X DB + B~ l NB, 

dove B" X DB e una matrice diagonalizzabile e B~ l NB e una matrice nilpotente. □ 

Esempio 3.3. Ridurre a forma di Jordan la matrice 



A = 



(0 


i 





2\ 

















3 





-1 













Si vede subito che -Pa(A) = A 4 (cioe A e nilpotente) e che dim 1^(0) = 2. Dunque, ci 
sono due blocchi elementari di Jordan. Poiche 



rii = dim(Ker/) =2, n 2 = dim(Ker/ 2 ) = 4, 



46 



Capitolo 3. La forma canonica di Jordan 



si hanno 



2rii — n — n 2 = blocchi di ordine 1, 

2n 2 — n\ — n 3 = 2 blocchi di ordine 2, 

2n 3 — n 2 — U4 = blocchi di ordine 3, 

2n 4 — n 3 — n 5 = blocchi di ordine 4. 



/ 
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io 





\ 










io 















1 ■ ■ ■ - 

!o 


1 




V 








jo 





/ 



Quindi la forma canonica di Jordan e 



J 



Una base di Jordan e 

^ = (0,1,0,0), u 2 = (0,0, 0, 1), *(ui) = (1,0,3,0), t(0 2 ) = (2, 0,-1,0). 

Esempio 3.4. Trovare una base di Jordan per l'endomorfismo /: M 3 — > M 3 rappre- 
sentato nella base canonica dalla matrice 

A = 

Gli autovalori so no Ai = con m\ = 1 e A 2 = 2 con m 2 = 2. Si ha 

£(0) = y(0) = Ker/ = £((2,l,l)). 
Inoltre, essendo £'(2) = Ker(/ — 2 Id) 2 , e poiche 

(A - 2lf 

risulta £(2) = £((1, 0, 0), (0, 0, 1)), e V = E(0) © E(2). Inoltre / x : E(0) -> £(0) e 
1'endomorfismo nullo ed / 2 : £(2) — > £(2) si scrive come f 2 = t 2 + 2 Id, ove t 2 e nilpotente 
di indice k 2 < m 2 = 2. Indicata con £> 2 = {(1,0,0), (0,0, 1)} la base di E(2) trovata, si 
ha 

/ 2 ((1,0,0)) = (3,0,1), / 2 ((0,0,1)) = (-1,0,1), 

dunque 





M B B \{h) = A 2 



3 -1 
1 1 



M%{t 2 )=T 2 



1 -1 
1 -1 



3.4. Casi particolari 
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Poiche Kert 2 = £((1, 1)) e Kert^ = IR 2 , t 2 ha indice 2. Si prenda v = (1,0) G Kert 2 , \ 
Kert 2 . Una base B' 2 di E{2) e data da ^(^O = (1, !)}• Rispetto questa base si ha 



1 




M B B ((f 2 ) = A' 2 = 



2 1 
2 



In conclusione, 





( 2 


1 






(o 


1 


o\ 




( 2 





o\ 


A ~ A' = 





2 


!o 













+ 





2 







V'o" 





\o) 













u 





0/ 



N + D. 



Quali sono le matrici P tali che A' = P~ 1 AP7 Basta scrivere nella base canonica le 
coordinate dei vettori della base B' 2 - Risulta v = (1,0,0), e t2(v) = (1,0,1). Insieme al 
vettore (2, 1, 1) e E(0) questi vettori costituiscono una base di Jordan per A. La matrice 
del cambiamento di base (rispetto alia base canonica) e 



P 




3.4 Casi particolari 

Caso n — 2. Sia A e K 2,2 , con Pa(A) = (A — A X )(A — A 2 ). Allora si distinguono i 
seguenti casi. 

1. Ai 7^ A 2 . Dunque A e diagonalizzabile. 

2. Ai = A 2 . Si ha 1 < h\ < 2. Nel caso in cui hi — 2, A e diagonalizzabile. Si consideri 
il caso /ii = 1. Risulta ti 7^ 0, dimKerti = 1, dimKert 2 = 2. Presi Vi £ V \ Kerti 
e ti(vi), rispetto tale base la matrice di ti e (§}), dunque 

Ai n 

aJ- 

Caso n = 3. Sia A G IK 3,3 , con P A (A) = -(A - A X )(A - A 2 )(A - A 3 ). Allora si 
distinguono i seguenti casi. 

1. Ai, A 2 , A3 distinti; in questo caso, A e diagonalizzabile. 

2. Ai = A 2 7^ A3. Si ha 1 < hi < 2 e /13 = 1. Nel caso in cui /ii = 2, A e 
diagonalizzabile. Nel caso hi — 1, procedendo come al punto precedente si arriva 
alia forma di Jordan 

'Ai 1 
A ! Ai 
A 3/ 
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Si confronti questo caso con l'esempio 3.4. 

3. Ai = A 2 = A 3 = A. Se hi = 3 allora A = XI. Sia hi = 2. Procedendo come sopra 
risulta 

fX 1 N 
A ~ A 
\0 A, 

Se hi — 1 risulta dimKertx = 1, dimKert^ = 2, dimKert^ = 3. Preso v G 
V \ Kertf, 1'insieme B = {tf(v),ti(v),v} e una base di Jordan rispetto alia quale 
si ha la forma canonica 

fX 1 N 
A ~ A 1 
\0 A, 



3.5 Riepilogo 

Sia A G C n,n . I passi necessari per ottenere la forma canonica di Jordan sono i 
seguenti. 

1. Trovare lo spettro di A, ossia 1'insieme degli autovalori di A. Si denotino con 
Ai,...,A r gli autovalori distinti di A, con mi, . . . ,m r ed hi,...,h r le rispettive 
molteplicita algebriche e geometriche. 

2. La forma canonica di A e la matrice J che ha sulla diagonale principale i bloc- 
chi Ji,...,J r , dove Ji £ c mi,m % e ciascun Jj e costituito dai blocchi diagonali 

t(1) t(^) 
d i i ■ ■ ■ i J i 

3. E poi necessario trovare l'ordine k^f 1 dei blocchi Se 1 < < rrii allora i 
blocchi di ordine k = k\^ sono 

2n k - n k _i - n k+ i, 

dove n k = dimKer(A — Xil) k . Oppure, posto r k = f rg(A — Xil) k il numero dei blocchi 
di ordine k e 

r k+1 + r fe _i - 2r k ; 
per ottenere questa relazione, si usi l'identita n k + r k = n. 

Da quanto detto, segue un importante risultato. Si denoti con spec(A) 1'insieme degli 
autovalori di una matrice quadrata A. 

Teorema 3.2. Due matrici A, B G C n ' n sono simili se e solo se 

1. spec(A) = spec(-B); 

2. rg(A — A/) fe = rg(_B — A/) fc per ogni k G N e per ogni X G spec(A) = spec(£?) 



3.6. Esponenziale di matrici e forma canonica di Jordan 
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3.6 Esponenziale di matrici e forma canonica di 
Jordan 

In questo paragrafo per il calcolo dell'esponenziale delle matrici sara sfruttato il 
seguente lemma di immediata dimostrazione. 

Lemma 3.1. Siano A, A' E K n ' n due matrici simili, con A' = B~ X AB. Allora 

e A ' = B- 1 e A B. 

Ora, si supponga che la matrice A ammetta la forma canonica di Jordan J = D + N 
(dunque A e J sono simili). Poiche DN = ND, risulta 



e J = e D e N . 



Pert ant o, 



Ai 

D = 



V 



Inoltre, poiche N e nilpotente di indice k, N k = O, dunque 



n 2 iy fc_1 



2! 

Se A e diagonalizzabile, allora N = O, dunque k = 1 e e N = I. Se A non e diagonalizza- 
bile, si ha k > 1. 

Esempio 3.5. Sia iV = (g J). Essendo N 2 = O, si ha 

S-T^AT-f 1 A J»S-(^ \f l ^_A Al ^ 



I + N ~ ( 1 ' 6 - I e**) 10 1) ~ \ 



Esempio 3.6. Sia 



Risulta 



MD 1 N 
A = |0 1 
,0 ; 



'o o r 

\ =|0 I (>. 

,0 0, 
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Dunque 



e N = I + N + 






0^2 



3 A2 



te A «)/2 N 

e A 2 



3 ^3 



Osservazione 3.2. In generate, se 



/0 1 
1 



N = 



0.. 
\0 .. 







1 

0/ 



e tale che N k = O, allora si ha 



/I n 
1 



2! 
J_ 
1! 




\0 



(fc-2)! (jfc-1) 



(fc-3)! (fc-2)! 



1 




1 

1 / 



Esempio 3.7. Trovare l'esponenziale della matrice 



A 




La forma canonica di Jordan ed altre quantita sono state ricavate nell'esempio 3.4. Si 
ha e A = Pe J P~ 1 , e 



dunque 



7 D+N 





'e 2 e 2 0^ 



1, 



3.7. Esercizi di riepilogo 
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3.7 Esercizi di riepilogo 

Esercizio 3.2. Si consideri Vendomorfismo /: M 4 
base canonica dalla matrice 

/0 1 \ 

-1 

10 

\l 1 / 



rappresentato rispetto alia 



A = 



1. Provare che f e nilpotente (si consiglia di usare il teorema di Cayley-Hamilton) . 

2. Dare la forma canonica di Jordan di A. 

3. Provare che v^-h = f h (^i) e una base di Jordan di A. 
SOLUZIONE. 

1. Si vede facilmente che -Pa (A) = A 4 , dunque per il teorema di Hamilton-Cayley si ha Pa(A) = 
—A 4 = O, cioc A e nilpotente. 

2. Troviamo V(0) = Ker/ = {(xi, x 2 , x 3 , x 4 ) e M 4 | x 2 = 0, x 4 = 0, Xl + x 2 = 0} = £((0,0,1,0)). 
Poiche dimy(0) = 1, si ha un solo blocco di Jordan di ordine 4. 

3. Ponendo h = 0, 1, 2, 3 si ha 

v 4 = ei, v 3 = e 4 , v 2 =e 1 -e 2 , Vi = -e 3 . 
Quindi, tenendo conto della matrice A, si ha 

f{vi)=0, f{V2)=V 1 , f(v 3 )=v 2 , f(Vi)=V 3 . 
La matrice associata ad / rispetto alia base {v\, v 2 , v 3 , v 4 } e proprio la forma di Jordan di A. 

□ 



Esercizio 3.3. Calcolare e B dove 



B = 



utilizzando direttamente la definizione. 



SOLUZIONE. Poiche B 2 = B si ha 




k=0 



k=l 



oo 1 



k=i 



□ 
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Esercizio 3.4. Si consideri I'endomorfismo f : 
base canonica) dalla matrice 



M 5 rappresentato (rispetto alia 





/3 


-3 


1 





o\ 




3 


-3 


-1 








A = 











1 


1 
















1 















0/ 



1. Provare che f e nilpotente. 

2. Dare la forma canonica di Jordan. 

SOLUZIONE. 1. Ricordiamo che / e nilpotente se e solo se ha come unico autovalorc A = 0. Si 
vede facilmente che Pa (A) = — A 5 = 0. 

2. Troviamo 1^(0) = £((1, 1,0,0,0)), quindi dimV(0) = 1. Si ha un solo blocco di Jordan di ordine 
5. 

□ 



Esercizio 3.5. Sia data la matrice 

A -- 



1 -1 




Provare che e A = (e — I) A + /. 

SOLUZIONE. Come b noto, = (e^)" 1 . Ora A 2 = A, quindi 

A k 



fc=0 



Essendo det(e^) = e, segue 



□ 

Esercizio 3.6. Sia A e M n ' n una matrice nilpotente. Provare che 

1. I — A e invertibile. 

2. (I- A)- 1 = I + A + --- + A n . 

SOLUZIONE. Se A b nilpotente, esiste un indice q > n tale che A q = (c A h = per h > q). 
Quindi 



I = I-A q = {I + A + A 2 + --- + A"- 1 )^ - A) 



(I - A)- 1 = I + A + ■ ■ ■ + A q - X + A q + ■ ■ ■ + A n . 



□ 



3.7. Esercizi di riepilogo 
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Esercizio 3.7. Si consideri Vendomorfismo f: M 5 — > M. 5 rappresentato (rispetto alia 
base canonica) dalla matrice 



A = 





1 


1 





o\ 








1 

















-1 


1 











-3 


-3 










3 


3/ 



1. Provare che f e nilpotente. 

2. Dare la forma canonica di Jordan. 

SOLUZIONE. 

1. Ricordiamo che / e nilpotente se e solo se ha come unico autovalore A = 0. Si vede facilmente che 
P A {\) = -A 5 = 0. 

2. Troviamo V(0) = £((1,0,0,0,0)), quindi dimV(0) = 1. Si ha un solo blocco di Jordan di ordine 
5. 

□ 

Esercizio 3.8. Si consideri la matrice 

(0 1 0\ 
10 
" 1 
\1 0/ 

1. Provare che A e normale e rappresenta una matrice di permutazione. 

2. Calcolare sin (f A 4 ). 

SOLUZIONE. 1. Ricordiamo che A e normale se e solo se AA* = A* A. Eseguendo i calcoli si 
conclude nel senso voluto. Inoltre A e una amtrice di permutazione poiche si ottiene permutando 
le colonne della matrice identica. 

2. Gli autovalori di A sono A = ±1, ±i. Quindi A c simile alia matrice diagonale D — diag(l, —1, i, —i). 
Ora A = B~ 1 DB implica A k = B~ 1 D k B, quindi, essendo D 4 = 7, 

sin (|A 4 ) = sin {^B^D^B) = sin = sin U = I. 

□ 

Esercizio 3.9. Si consideri per ogni a G C la matrice 

a _ A + a ~ a 

y a 1 — a 

1. Per ogni k G N determinare gli interi peg tali che A k = pi + qA. 
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2. Calcolare e A . 

3. Calcolare la forma canonica di Jordan. 



SOLUZIONE. 1. Si vede facilmente die 



A k = 



1 + ka —ka 
ka 1 — ka 



= pI + qA 



p = l-k, 
q = k. 



2. Tenendo conto che A k = (1 - k)I + kA si ha 



E 



fe=0 



A k 
Jd 



1 

E jfej 



.fe=0 



E 

.fe=0 



fc! 



E 



Lfe=o 



A:! 



A. 



Ora, 



quindi 



OO OO , OO 

El \ "V fc \ "V 1 

fc! = e; 2^ fc! = ^ Cfc - 11! = 



k=0 



k=0 



k_ 
fc! 



k=i 



(k-iy. 



e A = eA. 



3. Gli autovalori di A sono A = 1 con moltcplicita algebrica 2. Determiniamo ora l'autospazio V(l), 
dato dalle soluzioni dell'equazione 

ax — ay = 0. 

Ora, se a = si ha V(l) = C 2 c quindi A = I e diagonale; sc a ^ si ha V(l) = {(x, x) \ x e C}, 
quindi dim 1^(1) = 1 ed A non e diagonalizzabile. In questo caso la forma di Jordan e 



J 



1 1 N 
I)' 



Una base di Jordan e data da e'i = (a, a), e' 2 = (1, 0), quindi la matrice del cambiamento di base 
e 

'a V 
, a , 



S = 



Si verihca facilmente che 



A = BJB- 1 . 



□ 



CAPITOLO 4 



LA GEOMETRIA PER LA GRAFICA AL 

COMPUTER 



4.1 Le trasformazioni geometriche 2D 

Sia a un piano euclideo, e $ : a — > a un'applicazione biunivoca. Allora $ si dice 
trasformazione del piano ct in se. Se G C a, allora C a e detto il trasformato di 

G tramite $. Se $ e "D^ 1 sono continue, le figure G e $(G) sono dette omeomorfe o 
topologicamente equivalenti. 

Nella grafica computerizzata sono particolarmente importanti le trasformazioni affmi 
e le loro composizioni. Si ricordi che $ e un'applicazione affine se $ = r o /, dove / e 
un'applicazione lineare e r una traslazione. Se P = (x y) T , dove (x, y) sono le coordinate 
di P E a (rispetto ad un sistema di riferimento (O, B) scelto) e P' — $(P), allora, com'e 
noto, 

P> = AP + B, A d ^M B B ($)=M B B (f), r(Q) = Q + B. (AAA) 
Se A = (jj) con det(A) ^0e5 = (x ,yo) T esplicitamente si ha 

J rr' = ax + % + Xq 
I y' = cx + dy + y 

Osservazione 4.1. Se P e P' sono rappresentati dai vettori riga (e non vettori 
colonna), come spesso accade nella grafica al computer, l'applicazione (4.1.1) va scritta 

P* = P T A T + B. 

Tuttavia, noi non useremo questa notazione. □ 
Siano Pi e Pi due punti del piano e 

P = (l-t)P 1 + tP 2 , te [0,1], 

cioe P E PiP 2 (questo risulta da P — Pi = t(P 2 — Pi)). Allora, considerando la funzione 
$ introdotta sopra, risulta 

P' = (1 - t)AP 1 + tAP 2 + B = (1 - t)(P[ - B) + t(P^ - B) + P = (1 - t)P{ + ii* 
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cioe P' 



e P{Pi, dove $(Pi) = P[ e $(P 2 ) = P^. 



Questa proprieta e di grande importanza nelle elaborazioni grafiche, perche consente 
di calcolare rimmagine trasformata di un poligono senza trasformare tutti i suoi infiniti 
punti, ma solo i vertici. Tenendo conto die ogni figura e approssimabile con un'opportuna 
figura poligonale, il vantaggio e ovvio. 

Si osservi, inoltre, che le trasformazioni affini conservano il parallelismo, cioe se r ed 
r' sono rette parallele e $ e una trasformazione affine, allora la retta $(r) e parallela alia 
retta $(r'). 

Nella grafica al computer una trasformazione geometrica modifica la locazione di un 
pixel dentro un'immagine; piu precisamente, se P(x, y) e un pixel dell'immagine di par- 
tenza (input), allora &(P(x, y)) = P'(x',y') e un pixel dell'immagine di arrivo (output). 
Poiche un pixel non e un punto, ma un quadratino, e le coordinate in generate non sono 
numeri interi, sono poi necessarie delle interpolazioni per assegnare il valore del pixel (ad 
esempio il livello di grigio). 

Le trasformazioni geometriclie sono necessarie in diverse applicazioni, sia per cor- 
regggere eventuali distorsioni geometriclie introdotte durante l'acquisizione dell'immagine 
(per esempio immagini acquisite mentre gli oggetti oppure i sensori sono in movimento, 
acquisizioni da satellite), oppure per introdurre effetti geometrici visivi. 

Naturalmente, si possono considerare anche trasformazioni non lineari (ad esempio 
warping transformations); il tipo di trasformazione da utilizzare dipende dal contesto 
applicativo. Per esempio, nella ricostruzione (restoration) di un'immagine, per eliminare 
semplici aberrazioni otticlie, introdotte in fase di acquisizione, si utilizzano trasformazioni 
spaziali lineari; invece, si usano trasformazioni non lineari nel caso di registrazione di piu 
immagini acquisite in tempo diversi in condizione di instability non lineare dei sensori. 

Le trasformazioni geometriclie piu usate sono composizioni (anche iterate) delle se- 
guenti trasformazioni affini elementari: traslazioni, trasformazioni di scala, rotazioni, 
ribaltamenti. Le matrici corrispondenti a queste trasformazioni vengono dette matrici di 
trasformazione. 

1. Traslazione . P' = P + B. Qui A = I. 

2. Trasformazione di scala . P' = KP, dove 



dove k x (risp. k y ) e il fattore di scala lungo l'asse x (risp. y). Per direzioni diverse 
dalle direzioni degli assi coordinati, il fattore di scala varia. Se h x — hy si ha 
una similitudine, usualmente detta ingrandimento se k x > 1 o rimpicciolimento se 
< k x < 1. Si osservi che 




fk x 0\ (1 0\ = fk x 0\ 

\0 l) \0 kyj \0 ky) 



4.1. Le trasformazioni geometriche 2D 
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Se G e una circonferenza di centro O e raggio 1, allora e un'ellisse di semiassi 
a = k x e b = k y . Naturalmente, se k x = k y , si avra una circonferenza di raggio r. 



3. Rotazione [16]. P' = R(<p)P, dove 

/cosy, -sin^y 
ysiny? cosy? y 

Si tratta di una rotazione di angolo ip intorno all'origine O. Questa trasformazione 
conserva l'orientazione: le matrici che intervengono hanno determinante positive 
Si rammenti che R((f) ■ R(ip) = R(<p + V0> e cne R(~ V 9 ) — R{v) T — -^(v 9 ) X - 



4. Ribaltamento [16]. P' = S(ip)P, dove 

/cos^ sin^y 
ysmy? — cosy?y 

Si tratta di un ribaltamento intorno alia retta di equazione y = tg(</?/2). Que- 
sta trasformazione non conserva l'orientazione: le matrici che intervengono hanno 
determinante negativo. Si rammenti che S(ip) ■ S(ip) — -^(v 9 — 



Osservazione 4.2. Le precedenti trasformazioni si estendono ad un piano proiettivo 
come segue. Si rappresenti P con le coordinate proiettive non omogenee (x, y, 1) al posto 
di (x,y) (si veda l'appendice A. 2). Allora 



p> = TP 





P' = KP 



cos (p —simp u\ / x\ Ix cos ip — y sm ip 
P' = R(ip)P = ( sin ip cos (p I y J = I x sin (p + y cos cp | = | y' | □ 
1/ \1/ V 1 



Due trasformazioni usate frequentemente, che sono composizioni delle precedenti tra- 
sformazioni, sono le seguenti. 
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1. Asimmetria (skew). P' = AP dove 



A 



1 tgct 
1 



x 



2. Forbice (shear). P' = AP, dove 




Osservazione 4.3. Con una scelta opportuna di riferimenti ortonormali, un'affmita 
si puo riportare sempre alia forma 

x' = ax, y' = by. 

In tal caso, seGe una figura e A(G) indica l'area di G, allora vale 

A($(G)) = abA(G). 

Naturalmente, se ab — 1, le due figure sono equivalenti. Ad esempio, se G e il cerchio 
unitario, $(G) e un'ellisse e ^($(G)) = it ab. □ 

Osservazione 4.4. Se la matrice A e ortogonale, si ha un'isometria, che si puo sempre 
rappresentare nella forma canonica x' — x, y' — y, cioe esiste un movimento che porta 
l'una nell'altra. Si ricordi che la composizione di movimenti non e commutativa. □ 

Come si diceva prima, ogni movimento si puo ottenere componendo le trasformazioni 
elementari di cui sopra. Ad esempio, la rotazione di un angolo ip di un oggetto intorno 
ad un punto (x ,y ) ^ (0,0) si puo considerare come la composizione delle seguenti 
trasformazioni elementari: 

1. traslazione tale che (xo,yo) i— > (0,0), rappresentata da 

(I -x 
T = 1 -y 
\0 1 

2. rotazione dell'angolo (p assegnato intorno all'origine, rappresentata dalla matrice 
R(ip) (osservazione 4.2); 




4.1. Le trasformazioni geometriche 2D 
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3. traslazione inversa (0,0) h- > (io,|/o), rappresentata da 

T- l = 




La rotazione cercata e rappresentata dalla matrice A = T 1 RT. 

Nei problemi concreti, date le figure G e G' = &(G), non e nota l'espressione analitica 
di che va trovata tenendo conto del modo in cui e acquisita l'immagine. Per esempio, 
durante l'acquisizione di un'immagine da satellite, pur conoscendo la cinematica del- 
la piattaforma spaziale, il suo assetto puo variare leggermente introducendo distorsioni 
imprevedibili deH'immagine acquisita. 

Un modo per risolvere il problema consiste nell'individuare nella scena alcuni punti di 
controllo (detti anche punti fiduciali) che siano ben visibili in G e G'. Se supponiamo che 
$ sia affine sono sufficienti 3 punti di controllo per calcolare i 6 coefficienti che individuano 
la trasformazione (cioe, i coefficienti di A e di B). 

Nel caso di immagini da satellite, con le trasformazioni affini si possono eliminare gli 
errori di rotazione e di cambiamento di scala (introdotti quando l'altezza del satellite 
varia rispetto all'orbita regolare prevista). 

Come sopra detto, mediante una trasformazione affine $ un triangolo va in un triango- 
lo, un rettangolo in un parallelogramma (si osservi che gli angoli non vengono conservati, 
in generate) a meno che <3> non sia una trasformazione di scala (similitudine) che con- 
serva la forma della figura. Quindi, se un rettangolo e trasformato in un quadrilatero 
(che non e un parallelogramma) non e possibile usare una trasformazione affine, ma una 
trasformazione piu generale. 

Nel caso particolare, basta una trasformazione proiettiva che dipende da 9 parametri 
omogenei, quindi 8 non omogenei. Se (xi,x 2 ,x 3 ) sono le coordinate omogenee di P e 
(x^x^x't) quelle di P', la trasformazione proiettiva e del tipo 

x[ = anXi + a 12 x 2 + ai 3 x 3 , 
x' 2 = a 2 \X\ + a 22 x 2 + a 23 x 3 , 
x' 3 = a 3i xi + a 32 x 2 + a 33 x 3 . 

Esercizio 4.1. Si provi che, alterando per un fattore di proporzionalitd i coefficienti 
della matrice, la trasformazione non muta. 

Nelle coordinate non omogenee ^'=xi/x 3 ed i]'^x 2 /x 3 la trasformazione non e piu 
lineare: 

H an£ + a 12 r] + a 13 , a 21 £ + a 22 r] + a 23 

a 31 £ + a 32 r] + a 33 ' 1 a 31 £ + a 32 r] + a 33 ' 

Osservazione 4.5. Ovviamente, si possono considerare anche trasformazioni 



x' = fi(x,y), y' = f 2 (x,y), 
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dove fi sono polinomi di ordine superiore al primo. Ad esempio la trasformazione 

( x' — a u x + a 12 y + a 13 xy + a 14 
\y' = a 2 \x + a 22 y + a 23 xy + a 2A 

porta 4 punti di controllo A, B, C, D e G nei punti A', B' ', C", £>' G G' poiche dipende 
da 8 parametri essenziali. Come caso particolare si consideri 

x' = xy + 1, y' = x. 

Allora il segmento di equazioni parametriche x = t, y = t (0 < t < 1) si trasforma 
nell'arco di parabola di equazioni parametriche x' = t 2 + 1, y' — t. □ 



4.2 Le trasformazioni geometriche 3D 



Si considerano sistemi di riferimento cartesiano Oxyz di tipo destro o sinistro. Nella 
grafica al computer si preferisce il destro per la rappresentazione di un oggetto ed il sinistro 
per il riferimento solidale con l'osservatore. II verso positivo degli angoli e l'antiorario per 
un sistema destro e quello orario per un sistema sinistro. 

Spesso risulta utile anche utilizzare coordinate cilindriche o sferiche [16]. 

Usando coordinate proiettive non omogenee (x,y, z, 1), le matrici delle trasformazioni 
affini dello spazio hanno la seguente struttura a blocchi: 

A B 
O 1 

dove il blocco A pilota le trasformazioni di scala e di rotazione, mentre B pilota le 
traslazioni. Anche le trasformazioni affini dello spazio conservano l'allineamento ed il 
parallelismo. Le trasformazioni elementari 3D sono le seguenti. 

• Traslazione . P' = P + B, rappresentata dalla matrice 

(\ x \ 

1 y 

1 z 

\0 1 J 

dove B = (x ,y ,z ) in coordinate affini. 

• Scala . P' = KP, dove 



(4.2.2) 










ky 








k z 




o\ 






(4.2.3) 



dove k x , k y , k z sono fattori di scala positivi. 



4.3. Quaternioni e rotazioni 3D 
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Rotazione intorno alPasse x . P' = R x (ip)P, dove 



(\ 0\ 

cos ip — sin tp 

sin ip cos ip 

\0 1/ 



Rotazione intorno all'asse y. P' = R y ((p)P, dove 



( cos ip — sin ip 0\ 

1 

simp cosy? 

\ 1/ 



Rotazione intorno all'asse z . P' = R z (ip)P, dove 



( cos </? — sin ip 0\ 

sin ip cosy? 

\ 



1 
1/ 



• Simmetria rispetto al piano xy. P' = S xy P, dove 



Sxy 



(I 0\ 

10 

0-10 

\0 1/ 



(4.2.4) 



(4.2.5) 



(4.2.6) 



(4.2.7) 



Analogamente per le simmetrie rispetto agli altri piani coordinati. 
Osservazione 4.6. 

• La composizione di rotazioni intorno alio stesso asse e commutativa. 

• La composizione di rotazioni intorno ad assi differenti non e una rotazione elemen- 
tare. 

• La composizione di rotazioni elementari intorno ad assi differenti non e commuta- 
tiva. □ 



4.3 Quaternioni e rotazioni 3D 

I quaternioni furono introdotti da W. R. Hamilton nel 1843 nel tentativo di genera- 
lizzare il campo dei numeri complessi per analogia con il passaggio dai reali ai complessi. 
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Dieci anni furono necessari ad Hamilton per rendersi conto che per effettuare questa gene- 
ralizzazione sarebbe stato necessario usare uno spazio di dimensione 4 anziche uno spazio 
di dimensione 3. 

I quaternioni hano innumerevoli applicazioni in Matematica, Fisica ed Ingegneria. 
Qui sara descritta un'applicazione di particolare interesse ingegneristico che riguarda la 
parametrizzazione del gruppo 5*0(3) delle rotazioni nello spazio euclideo 3D mediante 
quaternioni unitari. Questa parametrizzazione permette di passare da una descrizione di 
5*0(3) mediante funzioni trigonometriche ad una descrizione che usa polinomi di secondo 
grado. II metodo permette una piu agevole calcolabilita delle matrici di rotazione, ed e 
usato in grafica 3D ovunque ci sia la necessita di calcolare un gran numero di matrici 
di rotazione (per esempio quando si muove il punto di vista in una scena). Altri utilizzi 
riguardano la robotica ed il controllo dei robot manipolatori [35]. 

I quaternioni possono essere introdotti equivalentemente in modo vettoriale o in modo 
matriciale. 

4. 3. a Quaternioni come vettori 

Si consideri lo spazio vettoriale (IR 4 , +, •). Si denoti 

1 = (1,0,0,0), i = (0,1,0,0), j = (0,0,1,0), k= (0,0, 0,1). 
In IR 4 si definisce una nuova operazione 

.:l 4 xl 4 ^K 4 

in questo modo: • e Tunica operazione, bilineare rispetto alia somma ed al prodotto per 
scalari, distributiva a destra ed a sinistra, tale che 

1*1 = 1, 1 • i = i = i • 1, l«j=j=j«l, l«k — k — k«l. 
i • i = — 1, j • j = — 1, k«k = -l, 

i • j = k, j • k = i, k • i = j, 
j«i = -k, k • j = — i, i • k = — j . 

Si noti che la proprieta di essere distributiva a sinistra ed a destra ha la seguente forma 
per ogni q, p, r G IR 4 : 

q»(p + r) = q»p + q»r, (q + p) • r = q • r + p • r. 

Proposizione 4.1. (IR 4 ,+,«) e un corpo, ossia e un insieme le cui operazioni sod- 
disfano le proprieta 

1. (M 4 , +, •) e un anello (rum commutativo) dotato di unitd; 

2. (M 4 \ {0},«) e un gruppo (nan. commutativo); 
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3. per ogni q, p, r G M 4 vale la proprieta distributiva (a sinistra ed a destra). 

La dimostrazione della precedente proposizione e molto semplice, e consiste nella 
verifica del fatto che • e associativa, che 1 e l'elemento neutro, e che esiste un elemento 
inverso di ogni elemento non nullo (si veda piu avanti per una sua espressione) . 

Definizione 4.1. L'insieme M 4 dotato delle operazioni + e • e detto corpo dei qua- 
ternioni, ed e denotato da H. 

Sia q e H, Si scrive 

q = q l + qii + g 2 j + <?3k = q + q. 

Si dice che go e la parte reale di q, e q = q±i + g 2 j + 93k e la parte immaginaria di q. 
Si defmisce il coniugato di q come il quaternione q = q — q. Si dice che un quaternione 
q e reale se q = q (ovvero se la parte immaginaria e nulla); si dice che un quaternione 
e immaginario se q = —q (ovvero se la parte reale e nulla). L'insieme dei quaternioni 
immaginari si denota con Mj. 

Si defmisce la norma di q come il numero reale non negativo \\q\\ = a/<2o + Qi + Q2 + Qs- 
Si noti che, in generate, q • p 7^ p • q. Valgono le seguenti proprieta. 

1. qmq = \\q\\ 2 ; 

2. \\p»q\\ = IMIIMI = \\q»p\\; 

3. p + q = p + q; 

4. q • p — p • q; 

5. q- 1 = q/\\q\\ 2 . 

Si notino le analogie e le differenze (date dalla mancanza di commutativita) di EI 
con C. In realta si puo dimostrare che le seguenti mappe iniettive commutano con le 
operazioni, quindi sono morfismi delle rispettive strutture algebriche: 

IR^C^H (4.3.8) 

dove rc(x) = x + iO, ch(x + iy) = x + yi + Oj + Ok. Si noti che i precedenti morfismi 
commutano anche con il modulo ed il coniugio. 

Esempio 4.1. Siano q — 1 — 2j + k, p = — 2 + i + 3k e H. Allora il prodotto q»p tra 
i due quaternioni vale 

g«p=(l-2j + k)«(-2 + i + 3k) 

= -2 + i + 3k + 4j - 2j • i - 6j • k - 2k + k • i + 3k • k 

= -5 - 5i + 5j + 3k 
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Esercizio 4.2. Siano dati due quaternioni 

q = qo + q\i + q 2 j + q?k, p = p + p ± i + p 2 j + p 3 k. 

1. Dimostrare che 

q*p= (-P3Q3 ~ P2<?2 - Piqi + PoQo) + (~P2<?3 + P3Q2 + Poqi + Piqo)i+ 

(Pl53 + P0<?2 - P3<?1 + P2<?o)j + (P0Q3 ~ PlQ2 + P2<?1 + P3<?o)k. 

2. Dimostrare che 

q»p-p»q = (-2p 2 q 3 + 2p 3 ?2)i + (2pi<7 3 - 2p 3 <?i)j + (-2pi<? 2 + 2p 2 <?i)k. 

4.3.b Quaternioni come matrici 

Sia 

H={.4 eC -|.4=(: 6 *),a, 6e c}. 

Si noti che I e mi sottospazio vettoriale reale di C 2 ' 2 di dimensione (reale) 4. Si puo 
dimostrare che EI e chiuso rispetto al prodotto di matrici. Se A e H, 

a + iai a 2 + ia 3 \ 2 2 , 2 , 2 



det A = det ) = a + + a 2 + a 3 , 

y— a 2 + m 3 ao — zai y 

dunque ieie una matrice invertibile se e solo se A ^ O. Si puo verificare che 

4* 

A- 1 1 



dove ||A|| e la norma di Frobenius (si noti che det A = ||A|| 2 ). 
Si introducano le seguenti matrici, dette matrici di Pauli: 

A /0 -A A 



Queste matrici sono usate in meccanica quantistica per formulare le equazioni di una 
particella non relativistica dotata di spin. 

Una base privilegiata di H e {Id, /, J, K}, dove / = ia 3 , J = ia 2 , K = io\. 

Proposizione 4.2. Si ha il seguente isomorfismo tra H ed M: 

e^EI, q = q + q l i + q 2 j + q 3 k^q Id + q l I + q 2 J + q 3 K, (4.3.9) 
0, equivalentemente 

M,fe„, 9l , fe9 3)»(* + ;* * + (4.3.10) 

\— q2 + iq3 Qo — ^QiJ 
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Per la dimostrazione basta verificare che la applicazione definita sopra trasforma l'o- 
perazione • nell'operazione di prodotto tra matrici. Si confronti l'isomorfismo precedente 
con risomorfismo (7.3.2) nel caso dei numeri complessi. 

Esercizio 4.3. Si dimostri che se il seguente isomorfismo trasforma q in A, allora q 
e trasformato nella matrice A*. 

4.3.c Quaternioni e rotazioni 3D 

D'ora in avanti sara usata la lettera H per indicare una delle due formulazioni dei 
quaternioni. Si noti che le operazioni di coniugato, norma, ecc. possono essere utilizzate 
anche nela formulazione matriciale in virtu del precedente isomorfismo. 

II sottospazio SU{2) C EI e l'insieme dei quaternioni unitari, ossia dei quaternioni q 
tali che \\q\\ = 1. 

Lemma 4.1. La seguente applicazione M 3 — > Mi, 

fx z — iy\ 
\z + iy —x J 

e un isomorfismo lineare (su WL). 

Dimostrazione. La linearita dell' applicazione e immediata, il fatto che e un isomor- 
fismo segue dall' iniettivita (banale) e dal fatto che la dimensione di entrambi gli spazi e 

3. \QED\ 

Teorema 4.1. L 'applicazione 

CK : SU{2) -> SO(3), q h-> CK(q) 

dove CJC(q): K 3 — > M 3 , T q (v) = qq$q~ l , e un morfismo di gruppi con nucleo uguale a 
{■■l<l\- 

Dimostrazione. Poiche = —q$ (essendo q$ immaginario) e q~ l = q (essendo q 
unitario) risulta, per ogni v G M 3 , 

QQvQ' 1 = q~ l ~qHq = -qq^q' 1 , 

quindi il quaternione qq$q~ x e immaginario. Per questo, esiste un vettore v' = (x 1 , y', z') 
tale che q-, = qq^q' 1 , dunque la definizione e ben posta. 
E facile verificare che l'applicazione CJC(q) e lineare. 

Si noti che det(q$) = x 2 + y 2 + z 2 = x' 2 + y' 2 + z' 2 = det(q-,), per la regola di Binet 
applicata al prodotto qq$q~ l . Pertanto CJC(q) e un'applicazione ortogonale. Rimane solo 
da verificare che questa trasformazione abbia determinante 1. Scrivendo 

/ x'i y' + z'i\ = / q + iq 1 q 2 + iq 3 \ ( xi y + zi\ fq - iq x -q 2 - iq 3 \ 
\-y' + z'i -x'i J \-q2 + iq3 qo - iqi J \~y + zi -xi J \q 2 - iq 3 qo + iqi J 



v = (x, y, z) -> q$ = xi + yj + zk = 



xi y + zi 
-y + zi —xi 
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si ha 

d = (-9s _ <?2 + 9? + ql)x + (-2q q 3 + 2q 1 q 2 )y + (2gig 3 + 2^92)^ 
y' = (2go<?3 + 2q 1 q 2 )x + (-ql + q\ - + ^q)^ + ( 2 <?2<?3 - 2q^q x )z 
z' = (2q x q 3 - 2q q 2 )x + (2q 2 q 3 + 2q q 1 )y + (ql - q* - qf + q*)z 

da cui si ottiene la matrice di CJC(q) rispetto alia base canonica C di M 3 

[Qq + Qi- ll-ll 2(g!g 2 -g g3) 2(gig 3 + q q 2 ) \ 
M C c (CIC(q)) = 2( qi q 2 + q q 3 ) q 2 - q\ + q\ - q\ 2(q 2 q 3 - q oqi ) , (4.3.11) 
\ 2(q 1 q 3 -q q 2 ) 2(q 2 q 3 + q Q q 1 ) ql - q\ - ql + ql) 

dove si ha ql + qf + q 2 + ql = 1. Si verifica (meglio con l'ausilio di un programma di calcolo 
simbolico, come maxima, liberamente disponibile in http://maxima.sourceforge.net) 
che il determinante di questa matrice e 1, che implica che la matrice e un elemento di 
S0(3). 

Richiedendo in (4.3.11) che la matrice sia uguale all'identita si ha che la parte imma- 
ginaria del quaternione q si annulla e si ha ql = 1, da cui si ottiene l'affermazione sul 
nucleo di CIC. \qed\ 

Definizione 4.2. II morfismo di gruppi CIC: SU(2) — > 5*0(3) defmito nel teorema 
precedente e detto parametrizzazione di Cayley-Klein del gruppo 50(3). 




Figura 4.1. Angoli di Eulero 



Si confronti la parametrizzazione (4.3.11) con la parametrizzazione di 50(3) data dagli 
angoli di Eulero (figura 4.1; si veda per la definizione degli angoli di Eulero [21], o un 
qualunque libro di meccanica razionale). Questa parametrizzazione permette di ottenere 
una matrice di rotazione generica (ossia un elemento di 50(3)) mediante la rotazione 
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di tre angoli ip, 9, ip rispetto a tre assi in successione. Piu precisamente, si osservi che 
ogni matrice di 5*0(3) e un'applicazione lineare che trasforma una base ortonormale data 
{e x , e y , e z } in un'altra base ortonormale {e±, e 2 , e 3 }. Quest'ultima puo essere individuata 
dalla seguente successione di trasformazioni ortogonali. 

1. una prima trasformazione ortogonale che porta la base ortonormale {e x , e y , e z } nella 
base ortonormale {e' x , e' y , e' z }. La trasformazione e una rotazione attorno all'asse 
e z (dunque e z = e' z ) di un angolo ip in modo tale che il trasformato e' x dell'asse e x 
giaccia nel piano individuato da {e*i, e 2 }. La matrice di questa trasformazione e 

'cos <p — sin <p 

simp cosy? | ; (4.3.12) 


2. una seconda trasformazione ortogonale che porta la base ortonormale {e' x , e' y , e' z } 
nella base ortonormale {e" x , e" y , e" z \. La trasformazione e una rotazione intorno 

— * — * — » 

all'asse e' x (dunque e' x = e" x ) di un angolo 9 in modo tale che il trasformato 
e" y dell'asse e' y giaccia nel piano individuato da {ei,e 2 }. La matrice di questa 
trasformazione e 

'10 

cos# -sin^ | ; (4.3.13) 
K sin 6 cos 9 

3. una terza trasformazione ortogonale che porta la base ortonormale {e" x , e" y , e" z } 
nella base ortonormale {ei,e2,e 3 }. La trasformazione e una rotazione intorno al- 
l'asse e" z (dunque e" z = e 3 ) che porta {e" x ,e" y } a coincidere con {ei,e 2 }. La 
matrice di questa trasformazione e 



(4.3.14) 



La generica matrice di SO(3) si ottoene, dunque, come il prodotto delle precedenti: 

'cos (p cos xjj — sin <p sin ip cos 9 — sin ip cos ip cos 9 — cos p sin ip sin <p sin 9 
cos p sin cos 9 + simp cos ip cos p cos ip cos 9 — sin ip sin ip — cos ip sin 9 
sin ip sin 9 cos ip sin 9 cos 9 

(4.3.15) 

E possibile ricostruire dalla precedente matrice un quaternione unitario che la descrive. 
In particolare, ponendo q = q^Id + q\l + q 2 J + q 3 K si ha 

^ + ^ ip-ip . 9 . . 

go = cos — - — COS 2' gi = cos — - — sin-, (4.3.16) 

ip — p> 9 ip + ip 9 

g 2 = sin — - — sin-, g 3 = sin — - — cos-. (4.3.17) 




68 



Capitolo 4. La geometria per la grafica al computer 



Questa corrispondenza e un'inversa della parametrizzazione quaternionica di 5*0(3). Da 
qui si puo dimostrare che ogni quaternione unitario q puo essere scritto come 

q = cos(a/2) + sm(a/2)q v . (4.3.18) 

Quindi, ogni quaternione unitario q ammette la seguente interpretazione geometrica: 
esso rappresenta una rotazione di un angolo a attorno ad un asse v. Si noti che i qua- 
ternioni unitari ±q rappresentano la stessa rotazione. Questo poiche l'asse di rotazione 
rappresentato dai vettori ±v e lo stesso. 

Si puo dimostrare che la parametrizzazione di Cayley-Klein per una serie di ragioni e 
molto piu efficiente degli angoli di Eulero in problemi come, ad esempio: 

1. la rotazione del punto di vista ('camera') dalla posizione (<f,9,ip) alia posizione 
(<//,£', V) [37]; 

2. la composizione di due o piu rotazioni: moltiplicare due quaternioni comporta l'ese- 
cuzione di 16 moltiplicazioni, mentre moltiplicare due matrici di S0(3) ne comporta 
27. 

Esercizio 4.4. Moltiplicare tra low i quaternioni q = 3 + 2i— j + 2k ep = — 1 — 2j + k; 
verificare che q • p ^ p • q. 

SOLUZIONE. Si ha q • p = -7 + i - 7j - 3k, p • q = -7 - 5i - 3j + 5k. □ 

Esercizio 4.5. Verificare che il prodotto dei quaternioni x = — i+j+4key = 
— 3 + 3j — k e uguale al prodotto delle corrispondenti matrici in HI. 

SOLUZIONE. Basta osservare che 

x=( 1 1 + 4 ^ v=( - 3 

□ 

Esercizio 4.6. Trovare tre quaternioni corrispondenti alle tre rotazioni usate nella 
parametrizzazione di S0(3) con gli angoli di Eulero. 

SOLUZIONE. Si puo iniziare ricavando il quaternione q v indotto dalla rotazione (4.3.12). Ugua- 
gliando le matrici (4.3.11) c (4.3.12) si ottengono 9 equazioni nelle 4 incognite go, <7i , ?2, ?3, componenti 
il quaternione q v . Delle 9, 4 sono 

<?l<73 = ±<7o<?2, q 2 q 3 =±qoqi, 

che implicano qi = qi = oppurc g = ?3 = (ma quest 'ultima si riconduce ad un caso banale). 
Richicdendo qi = q 2 = e ricordando che q v e unitario si ha 

d v ={ C0S % iSin |V (4.3.19) 
v \i sin ^ cos f J 
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Analogamente si trova che 

/cosf+zsinf \ /cos f isinf\ , on\ 

9 * = V cosf+zsinfj' ^=Uinl cos | J " (43 - 20) 



□ 



Esercizio 4.7. Dimostrare le formule (4.3.16) e (4.3.17). 

SOLUZIONE. Basta calcolare il prodotto q^qeq^p delle matrici dcll'esercizio prcccdentc. □ 

Esercizio 4.8. Trovare il quaternione unitario corrispondente a p = — 1 — 2j + k. 

Individuare la matrice di SO(3) descritta da p. Individuare i tre angoli di Eulero della 
corrispondente matrice di rotazione. 

SOLUZIONE. II quaternione unitario corrispondente ape 

a = M = 7s < ~ 1 ~ 2i+k> ' 

Per trovare la matrice di 50(3) corrispondente a q si utilizzi la matrice (4.3.11) sostituendo i valori 
dei cocmcienti di q. 

Per trovare gli angoli di Eulero si puo utilizzare la matrice di rotazione trovata sopra ed uguagliarla 
alia (4.3.15). Ovviamente si possono subito trovare valori di 9 utilizzando il tezo elemento della terza riga, 
poi gli altri elementi usando la terza riga e la terza colonna. Verificare il risultato su tutti gli elementi. 
Un procedimento alternativo puo essere quello di usare le formule (4.3.16) e (4.3.17). □ 

Esercizio 4.9. Si interpreti geometricamente la matrice di rotazione corrispondente 
ad un quaternione unitario del tipo w = a + 6iGCcH. 

Esercizio 4.10. (Esercizio non banale - si pensi alle radici di un numero complesso 
per analogia.) Descrivere Vinsieme delle soluzioni (se esistono) delV equazione x 2 = z, 
ove z = 2i — j + k ed x <EW e una incognita. 



4.4 Trasformazioni parallele e trasformazioni pro- 
spettiche 

II modello di mondo che usualmente adoperiamo e uno spazio euclideo tridimensionale, 
mentre lo schermo di un computer e una porzione di piano bidimensionale. Ogni processo 
di rappresentazione di uno spazio tridimensionale su uno spazio bidimensionale e chiamato 
una proiezione. Praticamente, si tratta di avere una visione bidimensionale di un oggetto 
tridimensionale che sia il piu possibile realistica od almeno significativa. 

Esistono molte vie possibile, ma due sono le tecniche principali di trasformazione di 
vista (3D viewing): le proiezioni parallele e le proiezioni prospettiche. 

Le proiezioni parallele sono particolari trasformazioni che, fissata una direzione visuale 
u, ad un punto P dell'oggetto fanno corrispondere un punto P' dello schermo ottenuto 
come intersezione del piano dello schermo con la retta r per P ed avente la direzione u. 
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Si noti che tutti i punti di r hanno come proiezione lo stesso punto P' . La proiezione e 
detta ortografica se u e perpendicolare alio schermo, altrimenti e detta obliqua. 

Rappresentazioni di questo tipo sono familiari agli ingegneri, che spesso usano un 
insieme di proiezioni ortografiche (sui piani coordinati), per esempio nelle proiezioni 
planimetriche di tipo architettonico. 

Analiticamente, si tratta di scrivere il cilindro che proietta l'oggetto su di un piano, 
parallelamente alia direzione data. 

Queste proiezioni, che danno informazioni precise sulle mutue distanze tra i punti non 
appartenenti a rette parallele ad u, non danno una vista realistica dell'oggetto. 

Le proiezioni prospettiche forniscono, invece, il realismo, rendono l'immagine bidi- 
mensionale come una fotografia; la grandezza degli oggetti dipende dalla distanza S dal- 
l'osservatore, che viene assimilato ad un punto, dal quale escono i raggi di luce riflessi 
dall'oggetto. 

Analiticamente, si tratta di scrivere il cono che proietta l'oggetto su di un piano 
avente il vertice E nell'osservatore. Se l'osservatore si sposta aH'infinito, il cono diventa 
un cilindro e la proiezione prospettica diventa proiezione parallela. 

Accanto a proiezioni prospettiche con un punto di fuga, ci sono proiezioni prospettiche 
con 2 o 3 punti di fuga. 

Nella proiezione centrale (con un punto di fuga), l'osservatore si trova su uno degli 
assi coordinati, la direzione visuale e quella che va dall'osservatore al centro del sistema 
di riferimento dell'oggetto, il piano di proiezione e spesso ortogonale a questa direzione. 
La proiezione avviene in due passi: 

1. si trasforma il sistema Oxyz nel quale e rappresentato l'oggetto nel sistema Ex e y e z e 
dell'occhio dell'osservatore; 

2. si trasforma quest'ultimo nel sistema del piano dello schermo x s y s . 

Passo 1. 1. Si trasla il punto di vista nell'origine di xyz. Indicata con 5 la distanza 
dell'osservatore dall'oggetto, la traslazione e rappresentata dalla matrice 



T = 



(I 








\ 





1 














1 


-5 













2. Si effettua una simmetria rispetto al piano x e y e per avere un sistema sinistra, 
tramite la matrice S xy (4.2.7). 

Quindi, questo passo e dato dalla matrice ST: 

x e = x, y e = y, z e = 5 - z. 

Passo 2. Si procede alia proiezione sul piano dello schermo x s y s , ortogonale all'asse z, 
avente distanza (focale) d dall'osservatore. Indichiamo con P la proiezione sul piano 
x s z s dell'oggetto (punto). 
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Guardando alle proiezioni ortogonali sul piano xz si ha 



X s 
~d 



X c 



dx 
5-z 



Alio stesso modo, nel piano yz si ha y s = dy/(5 — z). Tale proiezione si chiama 
ad un punto di fuga, poiche il piano di proiezione e perpendicolare alia direzione 
di vista e le rette parallele axe quelle parallele ad y rimangono tali anche nella 
proiezione, mentre le rette parallele a z convergono ad un punto (il cosiddetto punto 
di fuga). 

Se il punto di vista e arbitrario, la proiezione avviene lo stesso seguendo i passi (1) 
e (2), ma il passo (1) e piu complicato: non basta, infatto, una traslazione per portare 
Oxyz in Ex e y e z e . In generale, la matrice che rappresenta il movimento e 



M 



( -sin# 

- cos 9 cos (p 

- cos 9 sin p> 
X o 



cos 9 0\ 

sin 9 cos Lp sirup 

■ sin 9 sin ip — cos p 5 

1/ 



dove 9, ip sono angoli che permettono di vedere l'oggetto da diverse posizioni; se p = e 
9 = —ir/2 si riottiene la matrice ST della proiezione centrale. Quindi 







(x\ 


Ve 


= M 


y 


Z e 




z 


w 




v) 



oppure (x e y e z e 1) T = M[x y z 1 



II passo (2) h uguale a quello della proiezione centrale 



dx e 



X a 



dye 

Ze ' 
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Variando 5 varia la grandezza dell'oggetto, variando e 9 (che si possono considerare 
coordinate sferiche) si avranno prospettive diverse, variando, invece, d si avra una modifica 
della grandezza deirimmagine ma non della prospettiva. 

4.5 Nota storica 

Nelle proiezioni prospettiche interviene in modo essenziale la geometria proiettiva, 
che storicamente nasce proprio dalla teoria e pratica della prospettiva sviluppatasi nel 
Rinascimento italiano [15]. 

Gia Euclide (III sec. a. C.) nell'opera "Ottica" costruisce una teoria scientifica della 
visione, che dal punto di vista della struttura interna puo considerarsi una parte della 
Geometria. Significativo e il teorema VIII, che stabilisce che la differenza apparente tra 
due grandezze uguali viste da distanze differenti e determinata non dal rapporto tra queste 
distanze, ma dai rapporti tra gli angoli visivi corrispondenti. 

I Greci avrebbero, quindi, costruito una perspectiva naturalis che e una prospettiva 
angolare, che porto poi alia perspectiva artificialis, che e una prospettiva lineare, derivata 
puramente da considerazioni geometriche. 

Per dipingere, i pittori del Rinascimento furono condotti alia Matematica, convinti 
che la Matematica e l'essenza del mondo reale, poiche l'universo e ordinato e spiegabile 
razionalmente in termini geometrici. 

Leon Battista Alberti (1404-1472) diceva anche il primo requisito per il pittore e 
conoscere la Geometria: gli occhi del pittore si trovano davanti alia tela come davanti ad 
una finestra aperta sul mondo. Si osservi che lo stesso termine 'fmestra' (window) e usato 
attualmente per denominare la porzione di schermo in cui e rappresentato il 'mondo'. 

I problemi che si trovano ad affrontare gli informatici per rappresentare sullo schermo 
gli oggetti tridimensionali sono analoghi a quelli incontrati dai pittori per rappresentare 
sulla tela il mondo che li circondava. 

Notevoli contributi alia teoria della prospettiva sono stati dati proprio da architetti ed 
ingegneri come L. B. Alberti, G. Desargues (1593-1662), J.V. Poncelet (1788-1867), G. 
Monge (1746-1823), col quale la prospettiva finisce di essere una 'geometria per pittori' e 
diventa 'geometria degli ingegneri', geometria per disegnatori tecnici che, dalle proiezioni 
si propongono di ricostruire l'oggetto raffigurato in forma e grandezza. 

La singolare bellezza della geometria proiettiva e l'elegante armonia delle sue dimo- 
strazioni fecero si che essa diventasse lo studio favorito dei geometri del XIX secolo, in 
particolare di J. Steiner (1796-1863), considerato come il piu grande studioso di geome- 
tria dei tempi moderni (paragonabile ad Apollonio nei tempi antichi). Steiner nutriva un 
intenso disprezzo per i metodi analitici, egli era del parere che i calcoli fossero sostituto 
del pensiero, mentre la geometria avrebbe dovuto studiare l'attivita creativa. Non si puo 
negare, pero, che i metodi analitici hanno contribuito in maniera determinante alio svi- 
luppo della geometria proiettiva, in particolare l'uso delle coordinate omogenee scoperte 
contemporaneamente da quattro matematici: J. Pliicker (1801-1868), K.F. Feuerbach 
(1800-1834), A.F. Mdbius (1790-1868) ed E. Bobillier (1797-1832). 
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II nuovo punto di vista (analitico) fu poi sviluppato da M. Chasles (1793-1890) e da 
F. Klein (1849-1925), che nel celebre "Programma" (universita di Erlangen, dicembre 
1872) fonda la geometria sullo studio delle proprieta che sono invarianti rispetto ad un 
fissato gruppo di trasformazioni. 

E cosi possibile costruire infinite geometrie a seconda del gruppo di trasformazioni 
scelto. 

«. . . la forma matematica si conosce 
attraverso le sue trasformazioni. 
Si potrebbe dire dell'essere matematico: 
dimmi come ti trasformano e ti dirb chi sei.» 
(G. Bachelard, Le nouvel esprit scientifique, 1949) 

4.6 Curve di Bezier 

Le curve di Bezier sono curve algebriche di terzo grado usate per approssimare archi 
di curve qualunque di cui siano noti i punti iniziale e finale ed i vettori tangenti in questi 
due punti. Queste curve sono usate nella grafica per disegnare, rappresentando oggetti 
reali od immaginari. Le curve di Bezier ammettono un analogo di dimensione superiore, 
le superficie di Bezier, per le quali si rimanda al testo [18]. 

II motivo per cui si preferiscono curve di terzo grado e che le curve di secondo grado 
sono 'poco versatili' e le curve di quarto grado sono difficilmente 'controllabili'. 

Siano Pq, P 3 G M 3 i due estremi di una curva di Bezier. I vettori tangenti in P e P 3 
sono assegnati tramite due punti Pi, P 2 £ M 3 , usando i vettori P 1 — P e P 3 — P 2 nel modo 
che segue. 

Sia p(i) = a 3 t 3 + a 2 t 2 + ait + a E IR 3 [t] . Richiedendo che 

p(0) = P , P(1) = P*, p'(0) = 3(P 1 -P ), p'(l) = 3(P 3 -P 2 ), 
dove il coefficiente 3 e inserito per motivi di comodita, si ottiene la curva 

p(t) = (1 - t) 3 P + 3f(l - t) 2 P l + 3t 2 (l - t)P 2 + t 3 P 3 . (4.6.21) 

Definizione 4.3. La curva (4.6.21) si dice curva di Bezier di grado 3 determinata dai 
punti P , Pi, P 2 , P 3 e M 3 . 

Proposizione 4.3. Le curve di Bezier di grado 3 risultano essere medie pesate dei 
polinomi di Bernstein di grado 3 (paragrafo A.J,.)- 

Dimostrazione. Segue la definizione dei polinomi di Bernstein e dalle proprieta (1) 
e (3) del lemma A.l. \qed\ 

Da questo fatto segue che le proprieta generali dei polinomi di Bernstein danno inte- 
ressanti proprieta delle curve di Bezier. Quindi, e bene generalizzare la definizione 4.3 ad 
un numero arbitrario di punti per poi analizzare le proprieta generali di queste curve. 
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Pi 




Figura 4.2. Una curva di Bezier 



Definizione 4.4. Siano P , . . . , P n G K 3 e t G [0,1]. Si definiscano 

pOdcf p 

pm^-m-^+tPi-^t), 



per r = 1, . . . , n, i — 0, . . . , n — r. 

La curva descritta da P${t) e detta curva di Bezier di grado n. 

L'algoritmo sopra descritto e dovuto a P. de Casteljau (1959), che lavorava per la 
Citroen, ma i suoi risultati rimasero coperti dal segreto industriale. I lavori di P. Bezier 
sono stati pubblicati nel '70 e servirono alio sviluppo di un sistema di CAD per l'industria 
automobilistica: Bezier lavorava, infatti, alia Renault. 

Osservazione 4.7. Una curva di Bezier di grado n non e piana, in generate, se n > 2. 

La relazione tra i polinomi di Bernstein e le curve di Bezier e descritta dal seguente 
teorema. 

Teorema 4.2. Per r e {0, . . . , n} si ha 



r 

pf(t) = Y. p ^ B W- 

3=0 
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Dimostrazione. Per induzione su r si ha 



PT(t) = (l-t)PT-\t)+tPT^(t) 

i+r— 1 i+r 

= (i-*)E w-w +* E p^i-lM 

k=i k=i+l 

i+r 
r 

Corollario 4.1. P»(f) = E?=o P j 5 "(*)- 

Da questa relazione seguono una serie di proprieta delle curve di Bezier, di seguito 
elencate. Sia Po(t) una curva di Bezier. 

1. Invarianza per affinita. Sia $: IR 3 — > R 3 una trasformazione affine, cioe = 
AX + 5, allora 

3 

Infatti 

^ $(p,)p^) = Y^APj + s)s;(t) 

j 3 

= AC£PjB?(t)) + B 

j 

= AP£(t) + B 
= *(P£(t)) 

2. Simmetria. P^f) = £\ Pn-jB^t) = £■ P n -^{\ - t). 

3. Invarianza per riparametrizzazione affine. Sia 

r . r . u — a 

ip: [a, o\ — > [0, 1J , if i— > t = 

o — a 

un cambiamento affine di parametro. Allora 
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dove per u G [a, b] si e posto 




de f AA (6-^)"-J(^-a) j 
U7 (&-a) n 



4. Precisione lineare. Si supponga che 



( 



1 - 



n 



J 



) 



Po + -P, 



n 



n i 



per j — 1, . . . , n — 1; ossia, si supponga che i punti siano uniformemente distribuiti 
nel segmento di estremi P e P n . Allora la curva P n (t) generata dagli n punti dati 
e il segmento di estremi P e P„. 

5. Proprieta dell'inviluppo convesso. P n (t) giace nell'inviluppo convesso dei pun- 
ti Pq, . . . , P n , dove per inviluppo convesso si intende 1'insieme delle combinazioni 



Intuitivamente, si puo pensare l'inviluppo convesso come il piu piccolo poligono (o 
poliedro, se la curva non e piana) convesso che contiene i punti dati (anche non 
come vertici). Tale poligono (o poliedro) e detto poligono (o poliedro) di controllo. 
Le curve di Bezier, in un certo senso, "assomigliano" al poligono di controllo, percio 
sono uno strumento adatto per disegnare curve. Piu precisamente il calcolatore puo 
disegnare le curve con una successione di operazioni matematiche semplici, senza 
usare l'espressione parametrica della curva, usando una procedura introdotta da de 
Casteljau che sfrutta la proprieta dell'inviluppo convesso. Infatti, dati i punti di 
controllo Po, Pi, Pi, P3, denotato con pj il punto medio tra Pi e Pj, si calcolano 
Pqi, Pi 2 e P23, e successivamente i punti medi P012 tra Pqi e P12, e P123 tra Pi 2 e 
P23 ed infine P0123 tra P012 e Pi23- H punto P0123 e sulla curva di Bezier definita 
dai punti P , Pi, P2, P3, come si verifica facilmente, e la curva risulta divisa in 
due parti dal punto Poi23 5 come si osserva dalla figura. Si puo verificare che i 
punti di controllo Po, P01, P012, P0123 determinano una nuova curva di Bezier che 
coincide con il ramo di sinistra della curva di Bezier determinata da Pi, P2, P3, P4. 
Ripetendo questo procedimento si guinge rapidamente al limite della risoluzione 
grafica richiesta; il calcolatore ora puo disegnare tutti i punti del tipo P0123 trovati 
con semplici operazioni di somma vettoriale e divisione per 2. 

La proprieta dell'inviluppo convesso e estremamente utile anche per il clipping [18]: 
la rimozione di linee indesiderate, o la colorazione di certe aree del piano o dello spa- 
zio sono semplificate controllando prima se le aree giacciono all'interno o all'esterno 
del poliedro, controllo semplice da realizzare per un poliedro di tipo convesso. Un 
altro campo di utilizzo di questa proprieta e quello del controllo delle collisioni di 
oggetti in grafica 3D, con un meccanismo simile a quanto spiegato sopra. 



lineari 



P = k P + ■■■ + k n P n , J2 k i = l - 
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6. Invarianza per combinazioni baricentriche. E chiaro che 

n n n 

3=0 3=0 j=0 

quindi se a e (3 sono coordinate baricentriche (a + f3 = 1) nel poligono di Bezier, 
allora a e (3 risultano coordinate baricentriche per le curve corrispondenti. 

In altre parole, noi possiamno costruire la media pesata di due curve di Bezier o 
facendo la media pesata dei corrispondenti punti sulla curva o facendo prima la 
media pesata dei corrispondenti valori di controllo, e poi trovare la curva. 

7. Controllo pseudo-locale. II polinomio di Bernstein 5™ ha un solo massimo per 
t = i/n. Cio ha applicazioni nel disegno: se si toglie solo il vertice Pi del poligono 
di controllo allora la curva risente in maniera sensibile di questo cambiamento solo 
intorno al valore i/n del parametro. 

Esempio 4.2. II seguente codice in PostScript™ mostra come i caratteri PostScript™ 
siano disegnati tramite curve di Bezier. Questo procedimento conserve di risparmiare mol- 
tissima memoria rispetto ai caratteri "bitmapped" , poiche l'archivio del carattere conserva 
solo le informazioni relative ai punti di controllo. 

/Times-Roman findfont 

40 scalefont 

setf ont 

newpath 

moveto 

(0) false charpath 
°/ stroke 

{[31 roll (moveto) ] == } 
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{[31 roll (lineto) ] == } 
{[71 roll (curveto) ] == > 
{ [ (closepath) ] == } 
pathf orall 

II codice dell'esempio fa produrre ad un interprete PostScript™ (come Ghostscript) 
i punti di controllo delle curve di Bezier die delimitano i margini della lettera 'O' dal 
carattere Times-Roman, ingrandendolo a 40 punti tipografici. Se si vuole stampare la 
lettera sullo schermo si levi il carattere di commento di fronte all'istruzione stroke. II 
risultato del precedente codice e il seguente: 

[14.4401855 27.0002441 (moveto)] 

[6.80029297 27.0002441 2.00024414 21.2570801 2.00024414 13.2399902 (curveto)] 

[2.00024414 9.47998 3.04199219 5.84008789 4.80029297 3.52001953 (curveto)] 

[7.12036133 1.0 10.6804199 -1.0 14.2004395 -1.0 (curveto)] 

[22.0803223 -1.0 27.0002441 4.78076172 27.0002441 13.0800781 (curveto)] 

[27.0002441 17.0400391 26.0197754 20.4399414 24.1604 22.8398438 (curveto)] 

[21.6403809 25.5998535 18.2802734 27.0002441 14.4401855 27.0002441 (curveto)] 

[(closepath)] 

[14.4401855 25.0 (moveto)] 

[16.2802734 25.0 18.1203613 24.4960938 19.5603027 23.5998535 (curveto)] 
[21.7202148 21.6398926 23.0002441 17.8798828 23.0002441 13.119873 (curveto)] 
[23.0002441 10.7597656 22.4643555 7.99975586 21.6401367 5.91967773 (curveto)] 
[21.2800293 4.91967773 20.6000977 3.91967773 19.6801758 2.99975586 (curveto)] 
[18.2802734 1.59985352 16.4802246 1.0 14.3601074 1.0 (curveto)] 
[12.5200195 1.0 10.7199707 1.67602539 9.32006836 2.83984375 (curveto)] 
[7.23999 4.67993164 5.99975586 8.7199707 5.99975586 13.1599121 (curveto)] 
[5.99975586 17.2399902 7.08789062 21.119873 8.7199707 22.9997559 (curveto)] 
[10.2800293 24.7197266 12.2402344 25.0 14.4401855 25.0 (curveto)] 
[(closepath)] 

[28.8798828 -0.0 (moveto)] 

L'istruzione xl yl x2 y2 x3 y3 curveto disegna una curva di Bezier a partire dal punto 
corrente (ossia il punto attualmente nello stack di PostScript), con punti di controllo 
(xl, yl) e (x2, y2) e con secondo estremo (x3, y3). L'istruzione moveto serve per cambiare 
il punto corrente. Le istruzioni contenenti roll servono per mostrare il contenuto dello 
stack. 

Si noti che non tutti i caratteri rivelano i propri punti di controllo: Adobe prevede 
un meccanismo per la 'chiusura' dei caratteri in questo senso. Se si desidera approfon- 
dire il linguaggio PostScript™ si consulti il sito http://www.adobe.com/ per guide di 
riferimento, manuali e specifiche dei caratteri. 

L'esempio e stato elaborato a partire dal testo [9], liberamente disponibile in Internet. 

Esercizio 4.11. Si dimostri che le curve di Bezier di grado 2 sono parabole. 
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Esercizio 4.12. Si provi che 

{Bm' = n{B^it)-Br l m- 

Esercizio 4.13. Si provi che il punto P0123; definito nel procedimento descritto dalla 
figura 4-3 giace nella curva di Bezier definita da Pq, Pi, P2, P3. 



CAPITOLO 5 



I SISTEMI LINEARI 

Sia A = (a,ij) G K m ' n e B G IK" 1 ' 1 . II problema di determinare gli X G IK"' 1 tali che 

AX = B (5.0.1) 

e detto sistema lineare. 

Questo capitolo e un'introduzione ai metodi per calcolare tutte le soluzioni di un 
sistema lineare. Questi metodi sono detti metodi diretti. 

I metodi considerati in questo capitolo sono essenzialmente metodi di fattorizzazione 
del sistema dato in due sistemi lineari piu semplici (di solito a matrice triangolare). 

5.1 Metodi di fattorizzazione: premesse 

I metodi di fattorizzazione qui considerati hanno tutti origine dalla seguente osserva- 
zione: se la matrice di un sistema e facilmente invertibile, il sistema e di facile risoluzione. 
Infatti, si verificano i casi seguenti: 

1. se m = n ed A e invertibile, allora 

AX = B =>■ X = A~ X B\ 

2. se m < n ed A ha rango m, e possibile, scambiando opportunamente le righe e le 
colonne di A, ricondursi ad una matrice A' = (C P\ ■ ■ ■ P n - m ) con C G K m,m in- 
vertibile. In questo sistema le incognite x m+ i,. . . ,x n sono parametri, dunque la loro 
determinazione e arbitraria. Quindi si ottiene una sola soluzione X' = ( 

(C P 1 ~.P n _ m )X = B X' = C~\B -x m+1 P-y x n P„) (5.1.2) 

per ogni valore dei parametri. 

II caso m > n puo non essere preso in considerazione poiche in ogni sistema di questo 
tipo ci sono sicuramente m — n equazioni che sono combinazioni lineari delle altre e 
possono essere scartate. 
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Un caso di matrice facilmente invertibile e il caso di una matrice triangolare superiore 
(inferiore) A e K n,n tale che det A = an • • • a nn ^ 0. Dunque, gli elementi diagonali non 
sono mai nulli, e, indicata con Z e K n ' n la matrice inversa incognita, si puo facilmente 
vedere che AZ = I se e solo se Z e triangolare superiore (inferiore). II sistema AZ = I si 
risolve ricorsivamente all'indietro (in avanti, con gli opportuni cambiamenti): 



0>n.nZr, 



a 



1 

nn 



k=i k=i+l 

Ovviamente, gli elementi vengono ricavati nell'ordine z nn , z n -i jn -i, z n -i jTl , .... Si puo 
dimostrare che il numero di operazioni che si effettuano e dell'ordine di n 3 /6 [5]. 

Analogamente, un sistema con matrice triangolare superiore (inferiore) invertibile 
puo essere facilmente risolto ricorsivamente all'indietro (in avanti, con gli opportuni 
cambiamenti) come segue: 

K 



n \ j=i+l J 



I metodi studiati in questo capitolo sono diretti ad ottenere da un sistema arbitrario 
con matrice incompleta A G C n,n una coppia di sistemi la cui matrice sia facilmente 
invertibile, mediante la fattorizzazione di A come 

A = CD =>- CDX = B =>- CY = B, DX = Y. (5.1.4) 

I due sistemi CY = B e DX = Y vengono poi risolti in successione con i metodi sopra 
descritti. II campo scelto e quello complesso C perche permette di descrivere la maggior 
parte dei problemi di natura ingegneristica 1 

Le fattorizzazioni che verranno studiate nei paragrafi seguenti sono: 

1. la fattorizzazione £U, dove L e unipotente inferiore ed U e triangolare superiore 2 ; 
essa e associata al metodo di Gauss. 

2. la fattorizzazione Q1Z, dove Q e una matrice unitaria ed R e una matrice triangolare 
superiore; essa e associata al metodo di Householder. 



1 Non tutti: ad esempio, in crittografia hanno notevole importanza i cosiddctti campi finiti Z p (p 
numero primo) , che hanno un numero finito p di elementi. 

2 L viene dall'inglese lower triangular, ed U da upper triangular. 
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3. la fattorizzazione £.£*, dove L e una matrice triangolare inferiore con an > per 
i = 1, . . . , n; essa e associata al metodo di Cholesky. 

L'idea e quella di raggiungere la fattorizzazione cercata mediante trasformazioni ele- 
mentari che non cambiano le soluzioni del sistema. Tali trasformazioni sono realizzabili 
come particolari matrici, e concorreranno alia formazione della fattorizzazione. 

Verranno ora analizzate le condizioni di esistenza ed unicita delle precedenti fattoriz- 
zazioni. 

Teorema 5.1. Sia A G C n,n . Si supponga che i minori principali di A siano tutti 
invertibili, esclusa al piu A; in altre parole, detA k ^ per 1 < k < n — 1. Allora esiste 
un'unica coppia di matrici L ed U, con L unipotente inferiore ed U triangolare superiore, 
tale che 

A = LU. 

Dimostrazione. Si proceda per induzione. Per n = 1 basta porre L = (1) ed 
U = (an). Sia valido il teorema per n — k — 1, e si consideri il caso n = k. Posto 




con a G C e D, C E C n>1 . sia A k _i = L k ~\Uk~i- Si ponga 

dcf (L k _ x 0\ dcf /E/fc-i V\ 

Lk ~{u* i ) ' Uk ~{o p)> 

dove (3 G C e U, V G C™' 1 sono quantita incognite. Allora 

f D = L k ^V, 
A k = L k U k & I C* = U*U k . 1 , 
[ a = U*V + [3, 

da cui risultano U e V univocamente determinate poiche L k _i e U k -\ sono invertibili, e 

p = a -u*v. \om 

II metodo di Gauss e stato applicato in [7] anche a matrici che non soddisfacevano 
le ipotesi del precedente teorema. In realta, vale il seguente risultato, che generalizza il 
precedente. 

Teorema 5.2. Sia A G C n,n . Allora, esiste una matrice di permutazione II tale che 
la matrice HA ammette una fattorizzazione CU. 

Dimostrazione. L'affermazione sara qui dimostrata solo per il caso in cui rg(A) = 
n — 1. In questo caso h possibile dimostrare che esiste una matrice di permutazione II 
tale che HA soddisfa le ipotesi del teorema 5.1. Infatti, esiste sicuramente in A una 
sottomatrice M' G C n-1 ' n ~ 1 tale che det M' ^ 0. Dunque, esiste una matrice di permu- 
tazione II' tale che (IlM.) n _i = M' . Continuando, esiste una sottomatrice M" G C n ~ 2 ' n ~ 2 



5.2. Trasformazioni sulle matrici 
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di (H'A) n -i tale che detM" 7^ 0: se questo non si verificasse, un qualunque sviluppo 
di Laplace di det(IlM.) n _i sarebbe uguale a 0. Ragionando come prima, ed applicando 
induttivamente il ragionamento si ottiene la tesi. \qed\ 

Si noti che la fattorizzazione CM nel caso generale ha poco interesse per le osservazioni 
fatte all'inizio di questo paragrafo (5.1.2). 

Piu in la (paragrafi 5.8 e 5.11) si dimostrera, con metodi costruttivi, che la fattorizza- 
zione QTZ esiste qualunque sia la matrice di partenza e che la fattorizzazione LL* esiste 
ed e unica sotto certe ipotesi. 

Per quanto riguarda l'unicita della fattorizzazione QTZ, se S G C n,n e diagonale ed 
unitaria (si veda il paragrafo 1.5), allora 

QR = QSS*R, 

dove QS e unitaria e S*R e triangolare superiore. Quindi, la decomposizione non e 
univocamente determinata. Se la matrice A e non singolare, le fattorizzazioni QTZ sono 
definite esattamente a meno di fattori di fase. 

Teorema 5.3. Sia A G C n,n tale che detA 7^ 0. Allora, se A ammette due fattoriz- 
zazioni QTZ: A = QR = Q'R' , esiste una matrice di fase S G C n,n tale che 

Q' = QS, R' = S*R. 

Dimostrazione. Infatti, si ha 

Q*Q' = RR' , 

dunque la matrice unitaria Q*Q' e triangolare superiore, quindi e diagonale. Si ponga 

s = q*q'. mm 

Corollario 5.1. Sia A G C n ' n tale che detA 7^ 0. Allora esiste un'unica fattorizza- 
zione QTZ A = QR tale che r^ > 0. 

5.2 Trasformazioni sulle matrici 

In questo paragrafo verranno descritte le trasformazioni che conducono alle fattoriz- 
zazioni del paragrafo precedente. 

Sia A G C m ' n . Denotiamo con A = (Ri) (risp. A = (Cj)), per % = l,...,m (risp. 
j = 1, . . . ,n), il partizionamento di A nelle sue righe (o colonne). II seguente teorema e 
di facile dimostrazione. 

Teorema 5.4. Siano A G C m,n , B G C™' 1 . Allora ognuna delle seguenti operazioni 

sulla matrice A = (A : B) 

1. scambio di due righe; 
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2. moltiplicazione di una riga per uno scalare non nullo; 

3. sostituzione di una riga Ri con la somma Ri + XRh, dove i ^ h e A G C. 

trasforma la matrice in una matrice completa di un sistema lineare equivalente al primo. 

Osservazione 5.1. II risultato precedente non vale per le colonne, in virtu del diverso 
significato che hanno le righe e le colonne della matrice di un sistema. Ma lo scambio 
delle due colonne j e j' nella matrice incompleta da un sistema lineare che ha soluzioni 
dove la j-esima componente e scambiata con la j'-esima rispetto al sistema di partenza. 
□ 

Quindi, le trasformazioni che vengono usate concretamente sono le trasformazioni del 
teorema 5.4 sulle righe e lo scambio di colonne nella matrice incompleta (tenendo conto 
dell 'osservazione precedente). 

Le trasformazioni precedenti sono realizzate madiante una moltiplicazione per oppor- 
tune matrici, come segue. Sia C = {e\, . . . , e n } la base canonica di C n . 

1. Lo scambio di righe di A e dato da Ujji A, dove Ujji = -Me(/), essendo 

f:C n ^ C n , (ei, ...,ej,..., e>, . . . e n ) (e u . . . , e>, . . . , e i? . . . e n ). (5.2.5) 

Si noti che lo scambio di colonne di A e dato da AUjy, dove Ujji e uno scambio di 
righe. 

2. La moltiplicazione di una riga per A G C \ {0} e data da Mi(X)A, dove si pone 
Mj(A) = f Mc{g), essendo 

5cC n ^C n , (ei,...,ej,...e n ) i-> (ei,...,Aej,...e n ). (5.2.6) 

3. La sostituzione di una riga con una somma (teorema 5.4) e data da Sij(X)A, dove 
Sij(X) = f A4(,(h), essendo 

h:C n ^C n , (e 1 ,...,e n )^(e 1 ,...,e i + Xe j ,...e n ). (5.2.7) 

Definizione 5.1. Le matrici delle applicazioni lineari del tipo di / (5.2.5) sono dette 
matrici di scambio. II prodotto di matrici di scambio da le matrici di permutazione. 
Esempio 5.1. 

1. Una matrice Ujji di scambio di righe ha l'espressione 

(\ ... ... ... 0\ 



.. 


. .. 


. 1 . . 


. 


.. 


. 1 .. 


. .. 


. 



(5.2.8) 



\o ... ... ... Ij 



5.3. Matrici elementari 
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in altri termini, Ujj/ e ottenuta da I scambiandone le colonne j e f '. Le matrici di 
permutazione sono tutte e sole le matrici che rappresentano le applicazioni lineari 
del tipo 

(e±, . . . , e n ) i— » (e ai , e CTn ), 
e sono ottenute permutando le colonne (o le righe) di /. 

2. Una matrice Mj(A) di moltiplicazione di una riga per uno scalare ha la forma 



Mi(X) = 



(1 














. . . 1 





.. 


. 





... 


A 


.. 


. 





... 





1 .. 


. 


\o 








. 1/ 



(5.2.9) 



3. Una matrice SV,(A) di sostituzione di una riga con una somma ha la forma 

(\ ... 0\ 



.. 


. 1 













.. 


. A .. 


. 1 .. 


. 



(5.2.10) 



V ••• o V 

se % < j. Invece, se % > j il coefficiente A si trova 'al di sopra' della diagonale. 
Esercizio 5.1. Presa la seguente matrice A 




realizzare la somma della prima riga moltiplicata per —2 con la terza calcolando la matrice 
S , 3i(— 2) ed eseguendo S , 3i(— 2) A. 



5.3 Matrici elementari 

In pratica, ognuna delle fattorizzazioni (paragrafo 5.1) della matrice incompleta A di 
un sistema lineare viene raggiunta mediante la moltiplicazione successiva per matrici che 
rappresentano trasformazioni che non cambiano le soluzioni del sistema. Le matrici che 
vengono usate sono opportune composizioni delle matrici precedents A questo scopo, 
introduciamo una vasta classe di matrici, comprendenti le precedenti. 
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Definizione 5.2. Siano a ECedX,Y E O 1 



\ {0}. La matrice 



E(a, X, Y) = I- aXY* E C n ' 



si dice matrice elementare. 



Si denoti con E n,ri C C n ' n l'insieme delle matrici elementari. 
Una interessante proprieta delle matrici elementari e la seguente. 

Proposizione 5.1. Siano a, r E C, ed X , Y E C n>1 . Allora vale 



E{a,X,Y)E{r,X,Y) = E{ 1 ,X,Y) 



dove 7 = a + r — ar(Y*X). 

La dimostrazione e lasciata al lettore. Tale proprieta afferma che il prodotto di matrici 
elementari e una matrice elementare. Viceversa, e sempre possibile decomporre una 
matrice elementare come prodotto di matrici elementari in piu modi. Ad esempio, dato 
7 E C e scelto a E C tale che a(Y*X) ^ 1, si ha 



Naturalmente, se £'(7, X, Y) e invertibile, lo sono anche i fattori. 

Una conseguenza immediata della precedente proprieta e la seguente. 

Proposizione 5.2. Una matrice elementare E(a,X,Y) E E"' n e invertibile se e solo 
se aY*X ^ 1. 

Dimostrazione. Per o = tutte le matrici elementari valgono /. 

Per a 7^ 0, se la condizione o~Y*X 7^ 1 e soddisfatta, applicando la precedente proposi- 
zione si trova unreC tale che E(t,X,Y) = E(a,X,Y)^ 1 . Viceversa, usando l'esercizio 
1.12 si vede che le matrici E(a, X, Y) tali che aX*Y = 1 hanno determinante nullo, quindi 
non sono invertibili. \qed\ 

Esercizio 5.2. Trovare r nella precedente dimostrazione. 

Proposizione 5.3. Siano U ,V E C" con U ^ O, V ^ O. Allora esiste E(a,X,Y) E 
E n ' n tale che 

1. E(a,X,Y)U = V; 

2. det E{a,X,Y) ^ 0. 

Dimostrazione. La condizione e verificata scegliendo un qualunque Y in modo che 
Y*U 7^ 0. Infatti, in tal caso si possono scegliere a ed X in modo che 



7 — c 



T = 



l-a(Y*X)' 



aX = 



U-V 
Y*U 



Inoltre, se Y e scelto in modo che anche Y*V 7^ 0, la matrice E(a, X, Y) ha determinante 
diverso da zero (dimostrarlo!). \ qed \ 
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Proposizione 5.4. Le matrici delle trasformazioni descritte nel teorema 5.4 sono 
matrici elementari. 

DlMOSTRAZIONE. Si ha: 

1. IL y = E(1,X,X) dove X = (0, . . . , 1, . . . , -1, 0, . . . 0)*. 

3 j' 

2. Mj(A) = E(l — X,Ei,Ei), dove E^ e l'i-esimo elemento della base dello spazio dei 
vettori colonna. 



3. Sij(X) = E(—X,Ei,Ej). 



\qed\ 



5.4 Fattorizzazione mediante matrici elementari 

Sia A G C n ' n . Usando la proposizione 5.3 e possibile fattorizzare A come A = EU, 
dove E e un prodotto di matrici elementari ed U e una matrice triangolare superiore. La 
dimostrazione di quest 'affermazione e costruttiva e consiste nel seguente algoritmo. 

Passo 1. Si pone A^ = f A, e si partiziona A^> a blocchi cosi: 

A™ = ^ ^ , C« G C, F« G C B - 1 ' B - 1 , G C 1 '"" 1 , T G C"" 1 ' 1 . 

Per la proposizione 5.3, esiste una matrice elementare E^ tale che 

dove G C. Risulta 



t lor 



EWA<» - ( C(2) 



dove G C 1 '" 1 e F^ G C n 1,ri 1 sono opportune matrici. Si ponga 



def 



Passo k. Sia 



A(k) /c(*> D™\ 

Ai) ={0 F«J« 



con (fc) G Tj" 1 '*" 1 , £> {fc) G C* -1 '"-^ 1 , G C n_fc+1 > n - fc+1 . Mora, per la 

proposizione 5.3, esiste una matrice elementare E tale che 

EF (k) = ( a Q F( f+i)^ , 
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dove a G C, T G C* 1 '" - *), F {k+1 ^ G C n - k ' n ~ k . Si ponga 

la matrice e una matrice elementare. Per rendersi conto di questo, si osservi 
che, se E = E(a,X,Y), si ha = E(a,X,Y), dove X = (O X) T G O 1 ed 

Y = (0 Y) T G O 1 . Si ponga A< fe+1 ) = E^AW; si ottiene 

con G T^' fe , D( fe+1 ) G C k ' n ~ k , F( fe+1 ) G C n ^' n " fe . 

Al passo n — 1 si ottiene una matrice A*™) triangolare superiore tale che 
A (n) = E (n-i) . . . ^(1)^(1) ^ A = £A (n) , 

dove si e posto E = f (-E*- 1 " 1 ) 1 • • • (i^™ -1 ^) \ La matrice puo assumere forme diverse a 
seconda delle particolari matrici elementari scelte per realizzare l'algoritmo. Nei prossi- 
mi paragrafi verranno introdotte due particolari classi di matrici elementari: le matrici 
elementari di Gauss e le matrici elementari di Householder. 



5.5 II metodo di Gauss 

II metodo di Gauss e stato introdotto in [16]. Si puo dimostrare [25] che il metodo 
di Gauss e il metodo che comporta il minor numero di calcoli tra i metodi che utilizzano 
esclusivamente combinazioni di righe e di colonne. 

L'obbiettivo di questo paragrafo e realizzare il metodo di Gauss come fattorizzazio- 
ne CU, ottenendo questa fattorizzazione mediante successive moltiplicazioni per matrici 
elementari. A questo scopo, si introduce una sottoclasse delle matrici elementari. 

Proposizione 5.5. Sia U G C 1 ' 1 tale che Ui ^ per un certo i G {l,...,n}. Si 

ponga Ui = UiEi~\ YUiEi, dove {E k }i< k < n sono le matrici della base canonica di C n>1 . 

Allora, esiste un'unica matrice elementare E(a, X, Ei) tale che 



(uA 



E{a,X,Ei)U = Ui 



Ui 



w 
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Dimostrazione. Dalla dimostrazione della proposizione 5.3, posto V = Ui, ed 
essendo E*U = Ui ^ 0, si ha 



aX=[0,...,0, 



Ui+l 



U r . 



Ui ' ' Ui 



dunque 



A 



E(a,X,Ei) 



-U(i +1 -)/Ui 
-Un/Ui 








\QED\ 



Definizione 5.3. Nelle ipotesi della precedente proposizione, la matrice elementare 
determinata univocamente) si dice matrice elementare di Gauss. 

E facile dimostrare che E(a, X, Ej) = S i+lt i{—u i+ i/ui) • • • S nti (—u n /ui). Da crE*X = 
risulta che la matrice e invertibile e 



A 



0\ 



... 1 ... 

... U(i +1 )/ui ... 



U n /Ui 



V 



In particolare, le matrici elementari di Gauss sono unipotenti inferiori. 

Esempio 5.2. Sia U = (2, 2, 3) T e C 3 ' 1 . Allora m = 2 ^ 0, aX = (0, 1, 3/2) T e 



E(a,X,E 1 ) 



1 N 
-1 1 
-3/2 1 



Teorema 5.5. S'm A e C n,n . 5e A soddisfa le ipotesi del teorema 5.1, allora I'unica 
fattorizzazione CU si pud ottenere mediante Valgoritmo descritto nel paragrafo 5.4, e 
risulta 

L = (E^y 1 ■ ■ ■ (E^-vy 1 , u = aw. 



Dimostrazione. Si indichi con a\V l'elemento generico della matrice A^. La ma- 
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trice elementare di Gauss E^ ha la forma 

Z 1 



E^ = E(a,X,E k ) 



—a 



(k) 

k+lk 



I a 



(k) 

kk 



\o 



.(*) 

l nk 



/a 



(k) 

kk 






1/ 



dove a ed X sono tali che E(a,X, E k )C k = {C k ) k (qui, C k sta per la colonna /c-esima di 
A( k \ e (Cfc)^ e il vettore ottenuto da C k come nella dimostrazione della proposizione 5.5). 
Questo ha senso solo se ^ 0. Per k — 1 questo e vero per ipotesi. Al passo k il minore 
principale (A^) k di A™ e tale che det(A( fc )) fc = det C^a k k k \ Ma det(A( fc >) fc ^ poiche il 
determinante delle matrici elementari di Gauss e 1 e 



det(A^) k = det (f?^" 1 ) • • • E^A) 



= det {{E {k ~ 
= det A fc , 



i) 



k 

) k .-.{E^) k A k ) 



da cui la tesi. 



\QED\ 



Osservazione 5.2. Si noti che la matrice L non e, in generate, una matrice ele- 
mentare: le matrici E^ ed E^ 1 ^ sono elementari ma definite tramite coppie diverse di 
vettori. 

L'algoritmo presentato nel paragrafo 5.4 usato con le matrici elementari di Gauss 
al fine di risolvere un sistema lineare AX = B prende il nome di metodo di Gauss. 
Ovviamente, il metodo di Gauss e completato dalla risoluzione dei due sistemi triangolari 
in cui e fattorizzato il sistema AX = B (paragrafo 5.1, equazione (5.1.4)). Di questi 
sistemi triangolari, il sistema LY = B e risolto durante la fattorizzazione, applicando 
l'algoritmo sopra descritto alia matrice completa (A\B), ed il sistema UX = Y puo essere 
agevolmente risolto con il metodo dato con l'equazione 5.1.3 (si veda l'esempio 5.3). 

E possibile determinare il numero di operazioni compiute durante il metodo di Gauss: 
esso e deH'ordine (asintotico) di n 3 /3 [2]. 

Osservazione 5.3. Risulta 



/ 1 



L = 



,(*) 
l k+ik 



I a 



(k) 

kk 



\ a nl /°11 



a 



(*) /_(*) 

nk I a kk 



o\ 
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Si noti che il prodotto delle matrici elementari di Gauss che formano L non e commutativo: 
Esempio 5.3. Si consideri il sistema lineare AX = B, dove 



/5 2 0\ 

5 2 

2 10 

\0 2 1/ 



B 



/12\ 

9 
5 

W 



E conveniente applicare le matrici elementari anche al termine noto. Dunque, risulta 



E W 



( 1 0\ 

10 

-2/5 1 

\ 1/ 

(I 0\ 



/5 2 12 \ 



(2^ 



1 







1 



{A^\B 



(4(3)|£(3)) = 



5 2 
1/5 
1 



\0 -2/5 1/ 



\0 2 

/5 

5 

1/5 

\0 



2 





2 




9 

1/5 

4 y 

12 \ 

9 

1/5 



1/5 2/5/ 



Dunque 



L = 



1 


2/5 





1 


2/5 



0\ 







U = A W = A ( 3 \ 



II sistema UX = B^ cosi ottenuto si puo risolvere "all'indietro" usando il metodo (5.1.3). 

Osservazione 5.4. II metodo di Gauss puo essere applicato anche a piu sistemi lineari 
simultaneamente purche abbiano la stessa matrice incompleta. In questo caso si procede 
come sopra, usando al posto del vettore B una matrice B e C n,s . Questo e utile nel caso 
del calcolo dell'inversa, dove il termine noto prende la forma B — I [7]. □ 

Osservazione 5.5 (Metodo del pivot). Sia A e C n,n tale che det A ^ 0. Allora 
una fattorizzazione UA = LU e ottenibile modificando il metodo di Gauss come segue. 
Al primo passo, esiste nella prima colonna di A un elemento non nullo; si scambi la 
corrispondente riga con la prima riga di A e si applichi il primo passo del metodo di 
Gauss. Al passo k si proceda alio stesso modo, operando gli scambi sempre sulla matrice 
di partenza. □ 

Esempio 5.4. Si consideri la matrice 



/ 1 1 2 

A= 2 2-1 



92 Capitolo 5. I sistemi lineari 

Si osserva subito die la matrice non soddisfa le ipotesi del teorema 5.1. Risulta: 



/ 1 0\ /ll 2 \ 

= -2 1 , A< 2 > = -5 . 
\ 1 1/ \0 2 3 / 

E necessario scambiare le ultime due righe. Risulta H23A = LU, dove 

/ 1 0\ /l 1 2 \ 

L= -1 1 , U = 2 3 . 
\ 2 1/ \0 -5/ 

Si noti che la matrice L e ottenuta scambiando i coefficienti relativi alle righe 2 e 3 nelle 
corrispondenti matrici elementari. 

Infine, si noti che scambiando le prime due righe di A si ottiene una matrice che 
soddisfa le ipotesi del teorema 5.1. Tuttavia, la fattorizzazione CU ottenuta da IT 12 A e 
diversa da quella precedente (verificarlo!). 

Osservazione 5.6. II metodo di Gauss puo anche essere applicato a sistemi per i 
quali la matrice incompleta e del tipo A e C m,n , con m > n e rg(A) = n. In questo 
caso, effettuando un ulteriore passo del metodo si arriva ad una matrice A^ n+1 ^ tale che 
(A( n+1 ^)ij = per i > j. Le righe n + 1, . . . , m di A^ n+1 ^ sono tutte nulle, quindi possono 
essere scartate, e si ottiene la fattorizzazione CU della sottomatrice di A (o di una sua 
permutazione secondo l'osservazione 5.5) contenente le prime n righe. □ 

Osservazione 5.7. II metodo di Gauss puo essere usato per calcolare il rango di una 
matrice A e C m,n . Infatti, se al passo k si incontra una colonna nulla, si va al passo 
successivo senza calcolare la matrice elementare relativa. Con un numero di passi uguale 
od inferiore a min{m, n} si ottiene una matrice a scalini. □ 

Osservazione 5.8. Una variante molto nota del metodo di Gauss e il metodo del 
massimo pivot parziale. Questo e una modifica del metodo di Gauss, e consiste nella 
selezione, al passo k, della riga con l'elemento di massimo modulo in F^. Ovviamente 
questo metodo consente di ottenere una matrice L tale che ||L||oo = 1- P er maggiori 
informazioni sull'analisi dell'errore si consulti [5, 13, 22, 28, 29]. 



5.6 Caso particolare: le matrici tridiagonali 

Esistono problemi nei quali e necessario risolvere un sistema lineare AX = B dove A e 
una matrice tridiagonale. Questo capita nei metodi per la ricerca degli autovalori di una 
matrice (come il metodo Q7Z), e in molti metodi per la soluzione di sistemi di equazioni 
differenziali discretizzate. Questi sistemi si risolvono velocemente con la fattorizzazione 
OA. 

Proposizione 5.6. Sia A e C n ' n una matrice tridiagonale soddisfacente alle condi- 
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zioni del teorema 5.1. Allora L ed U hanno la forma 

( olx a 12 



(\ 

A l 







u 



\0 ... P n -! lj 



\ 



&n— 1 O^n— In 

a n ) 



Dimostrazione. La dimostrazione e costruttiva, e consiste nel confronto tra i coef- 
ficienti di LU e di A. Si ottiene il sistema 



OL\ — a li 

PiOti = a (m) j, i = l,...,n-l, 



, n — 1. 



Nel sistema si risolve prima la seconda equazione e poi la terza per i = I, . . . ,n — 1. E 
necessaria la condizione a« ^ per risolvere la seconda equazione. In realta si vede subito 
che 

det A = det L det C/ — a\ - • • a n , 

dunque la condizione ctj ^ per i = 1, . . . ,n equivale alia condizione sui minori di A 
richiesta dal teorema 5.1. \qed\ 

Si noti che il numero di operazioni necessario alia fattorizzazione CM e 2n — 2 in questo 
caso. Si noti, inoltre, che la verifica ctj ^ puo essere eseguita durante il calcolo. 

Esempio 5.5. Sia 



A = 



Risulta, seguendo i calcoli della precedente dimostrazione, 



U 



(I 


2 





o\ 


3 


5 


-3 








4 


14 













-v 



(i 








o\ 


3 


1 











-4 


1 













V 



/l 


2 





o\ 





-1 


-3 











2 





VO 








"2/ 



5.7 II metodo di Gauss- Jordan 

II metodo di Gauss- Jordan 3 e una variante del metodo di Gauss nella quale al passo 
k si annullano tutti gli elementi sulla colonna k + 1 tranne l'elemento sulla diagonale. 
Tramite questo metodo si ottiene una fattorizzazione A = ED, dove E non e una matrice 
unipotente inferiore come nel metodo di Gauss, ma D e una matrice diagonale. 



3 Wilhelm Jordan, 1842-1899 
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Proposizione 5.7. Sia U G C™' 1 tale che U{ ^ per un certo i G {1, . . . ,n}. Allora, 
esiste un'unica matrice elementare E(a, X, EA tale che 



E{a,X,Ei)U = u i E i 



Ui 



w 



La dimostrazione e simile a quella della proposizione 5.5. Le matrici elementari del 
tipo della precedente proposizione sono dette matrici elementari di Gauss-Jordan. 

Ora, si consideri l'algoritmo descritto nel paragrafo 5.4, e si utilizzi come matrice E^ 
la matrice elementare di Gauss-Jordan E(cr, X, E^+i) che trasforma la colonna /c-esima 
Ck+\ di nel vettore che ha la sola componente non nulla al posto k. Si ha 





A o .. 


(fc) / (k) 

■ - a lk/ a kk ■ 




E {k) = 







-a (k) la {k) 

a k-lk/ a kk ■ 
1 

(k) I (k) 
a k+lkl a kk ■ 


. 
. 
. 




\o 


(k) , (k) 
a nkl a kk 


• V 



La matrice A^ k+1 ^ e tale che il blocco (7^ +1 ^ e diagonale. 

Le condizioni di fattorizzabilita sono le stesse descritte nel teorema 5.1 e nell'osserva- 
zione 5.5. II sistema diagonale si risolve con una versione semplificata del metodo usato 
per i sistemi triangolari. II numero di operazioni effettuato, approssimabile con n 3 /2 [2], 
e superiore a quello del metodo di Gauss, ma c'e' un caso particolare dove questi due 
metodi danno il risultato con le stesse operazioni, ed e il calcolo della matrice inversa. 

Esempio 5.6. Si inverte la matrice 



A 
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col metodo di Gauss- Jordan. I passi necessari forniscono le matrici 

, (A^\B^) 

(aw\bv>) = 



La matrice inversa si trova risolvendo il sistema diagonale con termine noto matriciale 
(A^\B^), ossia dividendo le righe per i coefficienti sulla diagonale di A^\ Si ottiene 



A-' l = 



5.8 II metodo di Householder 

Malgrado il fatto che il metodo di Gauss sia "ottimale" rispetto al numero delle ope- 
razioni, e interessante studiare anche altri metodi che in particolari circostanze forniscono 
il risultato piu rapidamente o con migliore approssimazione. 

II metodo di Householder sfrutta l'algoritmo presentato nel paragrafo 5.4 impiegando 
una particolare classe di matrici elementari, introdotta di seguito. 

Definizione 5.4. Siano (3 E R, V E C 11 ' 1 \ {O}. Se la matrice elementare 

P = E((3, V,V) = I- (3VV* 

e unitaria, allora P si dice matrice elementare di Householder. 

Se P e una matrice elementare di Householder, allora valgono le seguenti proprieta, 
di verifica immediata: 

1. P e hermitiana; 

2. P' 1 = P; 

3. (3 = 2/\\Vf; 

4. P e la simmetria ortogonale rispetto alio spazio vettoriale C(V) ± (per dimostrare 
questa proprieta basta provare che PX = P(kV+Y) = —kV+Y, dove Y E C(V) L ). 

II seguente teorema assicura l'esistenza di matrici elementari di Householder che 
realizzano l'algoritmo del paragrafo 5.4. 
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Teorema 5.6. Dato X e 



■>n,l 



{O}, esiste una matrice elementare di Householder 



P tale che PX = o>E\, con aGC \ {0}. 

Dimostrazione. Le quantita da determinare sono a e V. 

1. Determinazione di a. Per il fatto che P e unitaria ed hermitiana devono essere 
verificate, rispettivamente, le seguenti equazioni: 



\\PX\\ = \\X\ 

x*PX e R 



\a\ 



X*aE l e 



La prima equazione da il modulo di a, l'argomento viene dalla seconda equazione, 
e deve essere tale che arg(aTf) + arg(a) = kn, con k E Z. Posto 



e 

risulta a = ±\\X\\9. 
2. Determinazione di V . Si ha 

PX = aE x 



se ii ^ 0, 

Fi| 1 ' ' 

1 se x\ = 0, 



((3V*X)V = X- aE v 



Ponendo V = X — aE\ si ottiene la soluzione del problema. Infatti 
2||X||(||X|| + |:r 1 |),e 



1 



v*x 



X 



\X a:i 



Risulta 



V 



[9(\ Xl \ + \\X\\)\ 

x 2 



\ 



\QED\ 



II teorema successivo collega il precedente teorema alia fattorizzazione Q1Z introdotta 
nel paragrafo 5.1. 

Teorema 5.7. Sia A e C n,n . Allora esiste una fattorizzazione A = QR, dove Q e 
unitaria ed R e triangolare superiore. 

Dimostrazione. La dimostrazione consiste nell'applicazione dell'algoritmo descritto 
nel paragrafo 5.4. La differenza col metodo di Gauss e che l'algoritmo e sempre applicabile 
in questo caso. Al passo k si pone 



se a£ } ^ 0, 



se a 



(fe) 
fcfc 
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Indicata con F^ la prima colonna di F^ k \ posto 



0W(\\FM\ 



+ i«S?l 



,(*) 



, /?<*>= 



cl II l u fefc I 



si pone P« = p( fc ) = V^ fc \ V^W). 

Risulta: 



R = A<> n \ Q = P (ir ' ■ • • = pW . . . 



iQg-D 



L'algoritmo presentato nel paragrafo 5.4 usato con le matrici elementari di House- 
holder al fine di risolvere un sistema lineare AX = B prende il nome di metodo di 
Householder. Valgono, per il metodo di Householder e relativamente alia soluzione del 
sistema con la fattorizzazione Q1Z, considerazioni simili a quanto detto per il metodo di 
Gauss. Inoltre, valgono conclusioni simili a quelle delle osservazioni 5.4, 5.6, 5.7. Invece, 
per quanto riguarda l'utilizzo di metodi del massimo pivot, si puo dimostrare che il me- 
todo di Householder non e influenzato dalla scelta di un elemento pivot con particolari 
proprieta [5]. 

Si puo dimostrare che il numero di operazioni effettuato per ottenere la fattorizzazione 
QTZ e approssimabile (asintoticamente) da 2n 3 /3 [2]. 

Esempio 5.7. Trovare la fattorizzazione QTZ della matrice 



1 2 -V 

2 10 
,3 -1, 



Si ha P« = / - (3^V^V^*. I calcoli verranno effettuati in maniera approssimata. Per 
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k — 1 vale 

0(i) = i p(i) = 0) 056365, V {t) = 

/-0, 26726 -0,53452 -0,80178\ 
p(!) = -0, 53452 0, 77454 -0, 33819 , 
\-0, 80178 -0,33819 0,49272 / 

/-3,7417 -1,0690 1,0690\ 

A (2) = p(i) A (i) = o -0,29450 0,87271 . 

\ -1,9418 0,30906/ 

Nella prima colonna di i valori nulli lo sono a meno di errori di arrotondamento. 
Proseguendo: 

#( 2 ) = -1, /?( 2 ) = 0,22544, V {2) = I -2.2585 



-1,9418, 





-0,14994 -0,98869 
-0,98869 0,14995 



Dunque, R = A (3) e 



'-3.7417 -1.0690 1.0690 \ 
= p(2) A (2) = | o 1.9640 -0,43643 
-0,81650/ 



'-0,26726 0,87286 0,40825 
Q= ( -0,53452 0,21823 -0,81649 
-0,80178 -0,43644 0,40825 



Si puo verificare che A = QR con un errore dell'ordine di 10 6 . 



5.9 Calcolo di basi ortonormali con il metodo Q7Z 

Siano dati m vettori in C n in forma di m colonne di una matrice A e C n,m . Si supponga 
che gli m vettori dati siano indipendenti. Si consideri il problema di estrarre dai vettori 
considerati una base ortonormale. E semplice modificare l'algoritmo del paragrafo 5.4 in 
modo che possa essere applicato alia matrice rettangolare A e C n ' m . In questo modo si 
puo calcolare una fattorizzazione Q1Z della matrice A. Si ottiene A = QR, dove 

Q e U(n,C), R = ( R A , R, G C m ' m . (5.9.11) 



5.10. II metodo di Givens 
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Proposizione 5.8. Nelle ipotesi precedenti, Q e una base ortonormale per IrafA, 
dove f A :C m ^C n e definita da f A (X) = AX. 

Ovviamente, il problema della ricerca di una base ortonormale puo anche essere ri- 
solto con il metodo di Gram-Schmidt. Questo metodo presenta un'emcienza di calcolo 
superiore di un fattore 2 rispetto al metodo Q7Z presentato sopra. Tuttavia, si puo dimo- 
strare che il metodo di Gram-Schmidt e numericamente instabile [22]. Anche modifiche 
di questo metodo (modified Gram-Schmidt algorithm, si veda [22]) presentano il difetto 
di essere numericamente instabili se i vettori della base ortonormale sono vicini in norma. 
Si puo dimostrare che il metodo Q1Z e il piu stabile [22, 6]. 

Osservazione 5.9. Si noti che, in linea di principio, sarebbe possibile realizzare una 
fattorizzazione Q1Z utilizzando il metodo di Gram-Schmidt. Ma questa, ovviamente, 
soffrirebbe dei problemi descritti sopra. 



5.10 II metodo di Givens 



II metodo di Givens e stato introdotto come metodo per annullare selettivamen- 
te singoli elementi di una matrice A G C n ' n mediante matrici unitarie. Esso consiste 
nell'applicazione del teorema 5.8 alia soluzione di sistemi lineari. 

Definizione 5.5. Siano i, j G N, con 1 < i < j < n. Si dice matrice di Givens una 
matrice Gij = (ghk) G C n ' n con elementi tali che 

1 se h = k e h ^ i, h ^ j; 

cos <f seh = k = ioh = k = j; 

9hk= {^P sin ip se h = j, k = i; 

— ip sirup seh = i,k = j; 

negli altri casi, 



dove <p G R e if; G C, \ifj\ 

c 

/l 



In altri termini e la matrice 



0\ 



/~i def 



.. 


cos ip . . 


— iftsintp . . 


. 


.. 


. ij} sin ip . . 


cos (f . . 


. 



1/ 



ovvero la matrice (ghk) che ha per sottomatrice la matrice 



9ii 9ij 
9ji 9 jj 



cos (f —ip sin ip 
ip sin <f cos ip 
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e nella quale gli altri elementi coincidono con gli elementi della matrice identita. 

Le matrici di Givens sono unitarie, e generalizzano a C n le matrici di rotazione di M 2 . 
Se U G M 2,2 e una matrice ortogonale, allora 

• se det U — 1, allora U e una matrice di Givens; 

• se det U — — 1, allora U e una matrice di Householder. 

Ovviamente, se A e C n ' n , allora G^- e una trasformazione elementare sulle righe di A. 
II prossimo teorema individua una sottoclasse di queste trasformazioni particolarmente 
utile. 

Teorema 5.8. Sia A e C n ' n . Siano an, a^ ^ 0. Allora esiste una matrice di Givens 
Gij tale che (GijA)ji = 0. 

Dimostrazione. La dimostrazione e costruttiva. Posto 

i> = — J - 



COS(/9 = — , S1IK/3 



I a ji I 



si ha 



\f\ttii\ 2 + |Oji| 2 a/ I a ii 1 2 + I Oji | 2 

(GrjjA)jj = ^ sin ipau + cos </?ajj = 0. 



\QED\ 



Ovviamente, e possibile realizzare una fattorizzazione Q1Z con le matrici di Givens. 
Ad esempio, per n = 4 tale fattorizzazione e ottenuta come segue 

R = G34G24G23G14G13G12A, Q* = G34G24G23G14G13G12. 

Tuttavia, il numero di operazioni effettuato e approssimabile con 4n 3 /3 [2], quindi e 
maggiore del numero di operazioni effettuate con le matrici elementari di Householder. 
Questa considerazione rende l'impiego delle matrici di Givens utile in casi particolari, 
come nel caso di matrici sparse (cioe con molti coefficienti nulli). 

Esempio 5.8. Data la matrice A = (3-1), si determina la matrice di Givens G12 
tale che G12A e triangolare superiore. Seguendo la dimostrazione del precedente teorema, 
sara 

q _ f cos (p —ip sin 
12 \ip sin tp cos (p 

dove ip = — 1, cosy? = 1/VlO e simp = 3/y/lO, dunque 

G12 = 



1/V10 3/V10 N 
-3/v^lO 1/vlO, 



5.11. II metodo di Cholesky 
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5.11 II metodo di Cholesky 

In questo paragrafo sara dimostrato che ogni matrice hermitiana A definita positiva 
ammette una fattorizzazione che si calcola in maniera relativamente piu rapida rispet- 
to agli altri metodi. Questa fattorizzazione e alia base del metodo di Cholesky per la 
soluzione di un sistema lineare del tipo AX = B. 

Teorema 5.9. Sia A e C n,n una matrice hermitiana e definita positiva. Allora esiste 
un'unica matrice triangolare inferiore L = (7^-) e C n ' n , con la > per i — 1, . . . ,n, tale 
che A = LL*. 

Dimostrazione. La dimostrazione e costruttiva. Si ha 



O-ij 



k=l k=l 



dove il secondo passaggio e dovuto al fatto che L e triangolare inferiore. Sara risolta, ora, 
l'equazione precedente per i > j (poiche A e hermitiana). Dalle equazioni 



a jj ~ Y2k=l \h&\ 2 1 3 — ^-i ■ ■ ■ i n i 

CLij J^fc=i hkljki i j 4" 1, • • • , Tl : j 1, . . . , Tl 1, 

si ricava direttamente 



(5.11.12) 



Ijj — y a jj Ylk=i l^'fel 2 , j — 1, • • • ,^ 

hj j~ (^ij X^fe=i hkljkj 5 i j 1 1) • • • j 3 I, ■ ■ ■ ,n 1. 



(5.11.13) 



\QED\ 



L'algoritmo presentato nel precedente teorema puo essere utilizzato al fine di risolvere 
un sistema lineare AX = B; esso prende il nome di metodo di Cholesky. 

II numero di operazioni da eseguire per trovare la fattorizzazione LL* e approssimabile 
da n 3 /6 [2]. Esso e inferiore al metodo di Gauss, ma il metodo non e applicabile a tutte 
le matrici. 

Osservazione 5.10. Gli elementi della matrice L vengono trovati a partire da In 
incrementando prima l'indice di riga e poi quello di colonna. Ad esempio, se n = 3, 
l'ordine in cui sono ricavati gli elementi di L e il seguente: 




Osservazione 5.11. Dalla prima equazione in (5.11.12) si ottiene \lj k \ < yfa^, dun- 
que HLlloo < V / PJU- D 
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Esempio 5.9. Si fattorizzi con il metodo LL* la matrice 

/ 1 1+i -1 \ 
A= 1 -i 6 1 -i \. 
\-l 1 + i 12 J 

Come prima cosa deve essere verificato il fatto che A e hermitiana e definita positiva. 
Usando la dimostrazione del teorema 5.9 si ottiene 

hi = Van = 1, hi = i~ (o 2 i) = 1 - i, hi = y-{ a 3i) = -1 

in hi 

I22 = V a 2 2 - \hi\ 2 = a/6 - |1 - i\ 2 = 2, l 32 = -j—(a 32 - / 3 i/ 2 i) — 1 + 

h2 

I33 = V a 33 - \hi\ 2 - K32 1 2 = 3. 



5.12 Esercizi di riepilogo 

Esercizio 5.3. Trovare Vinversa della matrice 

A = 





con il metodo descritto nel paragrafo 5.1. 

Esercizio 5.4. Trovare, con il metodo di Gauss-Jordan, Vinversa della matrice 



A = 



Risultato: 

/ -1/2 1/4 N 
A' 1 = 1/2 1/2 
\ 1/2 1/4, 

Esercizio 5.5. Si trovi la fattorizzazione CM della seguente matrice, ricorrendo, se 
necessario, al metodo del pivot 

( 1 1 -1 0\ 
2-110 
1-220 
V-l 1 1 2/ 

Esercizio 5.6. Se U <E C n e un vettore di lunghezza unitaria, allora E{2, U, U) e una 
matrice di Householder. 



5.12. Esercizi di riepilogo 

Esercizio 5.7. Sia data la matrice 
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D 



1 -i 2 
% 1 

2 1 



1. Dire quali fattorizzazioni di D sono realizzabili (tra le fattorizzazioni studiate LU, 
Q7Z, CC* ) e quali no, motivando le risposte. In caso affermativo, dire quante 
fattorizzazioni esistono. 



2. Trovare la matrice elementare di Householder P tale che PC\ = aE\, dove a G C\0 
ed E 1 = (1,0, 0) T . 



3. Trovare una fattorizzazione UD = LU, dove H e un'opportuna matrice di permuta- 
zione. 

SOLUZIONE. 

1. I minori principali hanno determinanti detl?i = 1, dct£>2 = 0, det£>3 = —4. Pcrtanto la matrice 
D non soddisfa le condizioni del teorema 5.5, ma esiste una matrice di permutazione II tale che 
UA ammette una fattorizzazione CIA. Inoltre, per il calcolo precedente risulta che anche se D c 
hermitiana, non e definita positiva, pertanto non si puo fattorizzare usando il metodo CC* . Una 
fattorizzazione Q1Z esiste ed e univocamente determinata a meno di matrici di fase (secondo il 
teorema 5.3). 

2. Banale. 

3. Si puo permutare la prima riga con la terza, ottenendo 



UD = 




In tal caso risulta 



/ 1 0\ (2 1 \ 

UD = LU = 0.5i 1 1 -0.5i 
\0.5 -i l) \0 2 ) 



Ovviamentc, questa non c Tunica permutazione di D che si puo fattorizzare! 



□ 



Esercizio 5.8. Sia data la matrice 



( 1 



2 

-2 1 

-1 -3 

2 



1\ 



B 



-1 




2 
1 



V 1 



1/ 



1. Sotto quali condizioni la matrice B ammette una fattorizzazione LU ? 



2. Si calcoli Vinversa di B con il metodo di Gauss-Jordan, ricorrendo, se necessario, 
ad una permutazione delle righe. 
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SOLUZIONE. 1. La matrice B ammette una fattorizzazione CU se i minori principali di ordinc 
1, 2 c 3 sono non singolari. Questo non e vero per B. 

2. Per quanto detto sopra, si calcola l'inversa di UB col metodo di Gauss-Jordan, ovc II e la 
pcrmutazione che scambia la seconda riga con la terza. Si ha: 



/I 


2 





1 


1 













2 





1 




1 


















-1 


-3 


1 


1 















-1 




-3 


1 







1 













-1 


-2 


1 


2 





1 

















1 


3 




1 


1 













V 1 


2 





-1 














v> 








-2 




-1 





V 














(I 


-6 


3 


1 


2 





°) 




A 







21 




7 


2 




6 










1 


3 


-1 







1 













1 




-10 


-3 


-1 


-3 














1 


3 


1 





1 










1 




3 




1 







1 











[p 





-2 


-1 








V 











-2 




-1 










V 




























A 













-7/2 


2 


6 


21/2 \ 





























1 










2 




1 


-3 




-5 
































1 







-1/2 





1 


3/2 


























\o 








1 




1/2 










-i/2y 



Si noti che, in questo caso, il metodo di Gauss- Jordan ed il metodo di Gauss procedono in modi 
molto simili. Posto 

/-7/2 2 6 21/2 \ 

2 -1 -3 -5 

-1/2 1 3/2 

\ 1/2 -1/2/ 

si nota che X = (IIS) -1 , da cui si ricava B^ 1 . 



X 



□ 



Esercizio 5.9. Sia data la matrice 



M 



(I 


2 


1\ 


-1 


-2 


1 


j 2 


1 


-1 


V 1 


1 -3 


0/ 



1. Quali fattorizzazioni della matrice M sono possibili, secondo le teorie studiate, al 
fine di risolvere un eventuale sistema lineare avente M come matrice dei coefficienti? 

2. Si calcoli l'inversa di M con il metodo di Gauss-Jordan, ricorrendo, se necessario, 
ad una permutazione delle righe. 

SOLUZIONE. 1. Essendo detM2 = 0, lc condizioni per la fattorizzabilita OA non sono verifi- 
cate. Ma detM = —2, quindi esiste una matrice di permutazioni II tale che IIM ammetta una 
fattorizzazione CIA. Una fattorizzazione CC* non e possibile pcrche la matrice M non e simmetri- 
ca. Una fattorizzazione Q1Z e sempre possibile, in questo caso e anche unica sotto le condizioni 
del teorema 5.3. 



2. Si proceda come per l'esercizio 5.8. 



□ 



Esercizio 5.10. Si determinino gli autovalori e gli autovettori della matrice XY* per 
X, Y e C \ {O}. 



5.12. Esercizi di riepilogo 
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SOLUZIONE. Si ha 

(XY*)Z = X{Y*Z), 

dove Y*Z = Y ■ Z e C. Pertanto la matrice XY* ha rango 1 in quanto l'immagine e C{X), e ci sono gli 
autovalori Ai = Y* X c X 2 = So Ai ^ X 2 , i corrispondenti autospazi sono 

V(Y*X) = C(X), V(0) = C(Y) ± , 

e la matrice XY* e diagonalizzabile. Se Ai = A 2 = allora V(0) = C(Y) ± , ma la matrice non c 
diagonalizzabile poiche XY* ^ O per l'ipotesi iniziale. □ 

Esercizio 5.11. Si dica per quali valori a, (5 G C esiste ed e unica la fattorizzazione 
LL* della matrice 

(a (3 N 
M — I —(3 a 13 

\ -P OL f 

e la si calcoli per tali valori. 

SOLUZIONE. Affinche la matrice sia hermitiana deve essere a € M e (3 — ib, con tel. Afhnchc 
sia definita positiva deve essere a > V%\b\. Applicando il procedimento iterativo si ottiene 



10 \ 

L v/77| -| 



□ 



CAPITOLO 6 

LA RICERCA DEGLI AUTOVALORI 



6.1 Premesse 

Data una matrice hermitiana A G C n ' n , si dice quoziente di Rayleigh rispetto ad un 
vettore I G C" \ {0} l'espressione 

Ra(X)S^. (6.1.1) 



Poiche A = A* si ha R A (X) = R A (X), cioe i^PO e reale. Posto Y = X/\\X\\ 2 , cioe 
|| Y || 2 = 1, ne segue che i quozienti di Rayleigh non sono altro che i valori che la forma 
quadratica Q(X) = (*X)AX assume sulla sfera unitaria di C n . 

La seguente proposizione mostra l'utilizzo del quoziente di Rayleigh. 

Proposizione 6.1. Sia A G C n ' n , e sia X un autovettore di A. Allora II quoziente 
di Rayleigh di A rispetto ad X e un autovalore di A corrispondente ad X . 

Dimostrazione. Infatti, se AX = XX, risulta X* AX = X*XX. \sM 

Poiche gli autovalori di A sono numeri reali, essi si possono ordinare in modo non 
crescente Ai > A 2 > ■ ■ ■ > A n . Un risultato dovuto a Courant e Fischer stabilisce che 

Ai = max{ J R A (X) | X G C\ X ^ 0} 
X n = min{R A (X) \ X G C n , X ^ 0} 

E possibile trovare facilmente autovalori di una matrice che sia un'espressione polino- 
miale di un'altra matrice di cui siano noti gli autovalori. 

Proposizione 6.2. Sia q(z) G C n [z] un polinomio. Sia A G C n ' n , X un autovalore di 
A ed X un suo autovettore. Allora q(X) e un autovalore di q(A). 



6.2 Localizzazione degli autovalori 

La localizzazione degli autovalori e importante in quanto il calcolo numerico degli 
autovalori e molto difficile. Infatti, i metodi studiati per la soluzione dei sistemi lineari 
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non si applicano direttamente, come si vedra nel paragrafo 6.3. Una prima soluzione del 
problema dela localizzazione degli autovalori e rappresentata dai teoremi di Gershgorin 1 . 

Teorema 6.1 (Primo teorema di Gershgorin). Sia A e C n ' n . Posto 

n 

d ={z eC\\z- a u \ < r,i}, ri = \ a ij\ (6.2.2) 

j'=i 

n 

C^IJa, (6.2.3) 

i=i 

allora A^gC per /c = 1, . . . , n. 
Analog amente, posto 

n 

Ci= f J2M ( 6 - 2 - 4 ) 

3=1 

(6.2.5) 

allora \ k E D per k — 1, . . . , n. 

Dunque, \ k € C fl D per fc = 1, . . . , n. 



Di ={z eC\\z- a u \ < Ci}, 

n 

D d = f {jD t , 

i=l 



Dimostrazione. Si applichi il teorema della diagonale dominante alia matrice A' = 
A — XL Se risultasse 

\a u - A| = \af u \ > \ a ij\ = l a ^'l = ri ' 

allora la matrice A' risulterebbe invertibile, quindi A non potrebbe essere un autovalore. 
Si proceda in modo analogo per le colonne. \qed\ 

Definizione 6.1. Nelle ipotesi del primo teorema di Gershgorin, i cerchi Ci C C ed 
i cerchi Di C D si dicono cerchi di Gershgorin. 

Si osservi che se A e diagonale, i cerchi si riducono a punti. 

Un secondo teorema permette di affinare la localizzazione degli autovalori. 

Teorema 6.2 (Secondo teorema di Gershgorin). Nelle ipotesi del primo teorema 
di Gershgorin, se m cerchi di Gershgorin C^, . . . , C« m formano un insieme connesso 2 
S = U™ =1 C ih disgiunto dai rimanenti n — m cerchi Ci, allora S contiene esattamente m 
autovalori di A, contati ciascuno secondo la propria molteplicitd algebrica. 



^emyon A. Gershgorin, 1901-1933 

2 si veda [12] per la definizione di 'insieme connesso' 
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Dimostrazione. Si ponga A = D + R dove D e la diagonale principale di A. Si 
consideri la curva t h- > = f .D + tR. Gli autovalori della matrice sono funzioni 
continue dei coefficienti di A(t), poiche i coefficienti del polinomio caratteristico sono fun- 
zioni continue di t e gli zeri di un polinomio sono funzioni continue dei propri coefficienti. 
Per t G [0, 1] ci sono m funzioni continue X^it), . . . , X im (t) tali che X ih (0) = a ihih e X ih {l) 
e un autovalore di A = A(l) (per h — 1,... ,m). Queste funzioni continue sono curve 
in S per t G [0, 1] poiche i loro punti iniziali sono in S, e poiche l'immagine dell'insieme 
connesso [0, 1], essendo connessa, non puo 'uscire da S\ \ Q ED \ 

E possibile applicare i precedenti teoremi al problema della localizzazione degli zeri di 
un polinomio. Infatti, come e facilmente dimostrabile, dato un polinomio monico 



p(x) = a + a\x H V a n ^ix n 1 + x n G C n [x 



(6.2.6) 



esiste una matrice A p , detta matrice compagna di p(x), tale che Pa p {x) = p(x); tale 
matrice e cosi definita: 



A, 



del 



( o 





1 







1 



o \ 







\-a 





-ax — a 2 



1 

-a n -i/ 



Applicando alia matrice compagna i precedenti risultati si ottiene il seguente teorema. 

Teorema 6.3 (Cauchy). Gli zeri del polinomio (6.2.6) si trovano nel disco di centro 
G C e raggio 

M = max{|a |, 1 + \a±\, . . . , 1 + |a n _i|}. 

Dimostrazione. Si consideri la matrice compagna A p del polinomio p(x). Appli- 
cando il primo teorema di Gershgorin (per colonne) risulta 

£>i = {z G C | |;z| < \oq\}, 
D 2 = {z G C | \z\ < 1 + |ai|}, 



D n ^i = {z G C | \z\ < 1 + |a n _ 2 |}, 

D n = {z G C | \z + a n _i| < 1} C {z G C | \z\ < 1 + |a n _i|} = D' n , 

poiche per la disuguaglianza triangolare risulta 

\\z\ - |a n _i|| < \z + a n _i| < I. 

La dimostrazione termina osservando che i dischi Di (i = l,...,n — 1) e D' n sono 
concentrici ed il loro centro e l'origine. \qed\ 



6.2. Localizzazione degli autovalori 
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Nota 6.1. Un altro risultato di localizzione, meno fine dei precedenti, e costituito dal 
teorema di Hirsch 7.7. 

Esempio 6.1. Si consideri p(x) = x 3 — 2x 2 + x — 2 = 0. Allora M = max{2, 2, 3} = 3, 
quindi le radici si trovano nel disco di raggio 3 del piano complesso. Infatti, con un 
semplice calcolo si puo verificare che le radici sono 2, i, —i. 

Esercizio 6.1. Trovare le regioni del piano complesso in cui si possono trovare gli 
autovalori della matrice 

(I -1 2 3\ 

3-12 



\l 2 15/ 

SOLUZIONE. Si ha 



A = 



ri =6, r 2 = 3, r 3 = 0, r 4 = 4, d x = 1, c? 2 = 3, d 3 = 4, rf 4 = 5. 
I cerchi di Gershgorin 



D A 



^-oT 

N X 

\ \ \ 
/ / \ \ \ 

7 £>i \ \ \ 

/ ../. \ \ \ 

f d '1 •. 3 : 1 ^ ' i 



H 1- 



-+- 



\. \ . i Ci C\ i Ci 

\ "V / / / . 

\ \ / / / 

> \ ' 1 / 



(si noti che C 2 = -D2) si trovano tutti all'interno del cerchio {z e C | \z\ < 9}. Dal primo teorema di 
Gershgorin si ha una stima ancora piu precisa: gli autovalori di A devono trovarsi nell'insieme 



(d u d) n (D 3 U D^. 
Infatti, dal calcolo risulta che gli autovalori di A sono A = 0eA = 9. 

Esercizio 6.2. Si localizzino gli autovalori della matrice 



□ 
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SOLUZIONE. Si ha 

d = {z e C | \z\ < 1} = C 2 = D 1 = D 2 , 
C 3 = {zeC\\z-3\=0} = {3} = D 3 
C = Ci U {3} = D x U {3} = D. 

Per il secondo teorema di Gershgorin, C\ U C 2 contiene 2 autovalori (si verifica che sono A = ±i), e C3 
contiene un solo autovalore, necessariamcntc A — 3. 




□ 



6.3 II metodo Q7Z per la ricerca degli autovalori 

La ricerca degli autovalori e un problema la cui soluzione e assai complessa nel caso in 
cui l'ordine della matrice non sia piccolo. Lo scopo di questo paragrafo e far vedere come 
il metodo di Householder sia usato a questo scopo, a scapito della sua minore emcienza 
computazionale rispetto al metodo di Gauss. 

Sia A e C n ' n diagonalizzabile, con D = T _1 AT diagonale. Si puo dimostrare [2] che 
l'errore che si commette nella ricerca degli autovalori di A e limitato dalla costante /x(T) = 
||T|| ||T _1 ||, detta numero di condizionamento di T, dove || • || e una norma matriciale 
tale che \\D\\ = maxj = i i ... )n {|djj|}. E evidente che la scelta di T unitaria permette di 
minimizzare tale valore: ad esempio, HTH^, HT -1 ^ < 1. 

Sara descritto, ora, l'algoritmo che e il nucleo del metodo Q1Z: il metodo stes- 
so e composto anche di altri passi, per i quali si rimanda a [5]. Si osservi che una 
matrice simile ad una matrice diagonalizzabile e diagonalizzabile: se B = S^ X AS ed 
A e diagonalizzabile come nell'enunciato precedente, allora D = (S^ 1 T)^ 1 B(S^ 1 T), e 
< || 1 S|||| 1 S- 1 ||||T||||T- 1 ||. 

Si ponga = f A. Al passo k, se la decomposizione Q1Z di A^ e A (fc) = QWR( k \ 
si pone 

A (k+i)<M R (k)Q(k)_ Risulta A (k+i) = Q(k)* A (k)Q(k)^ u metodo e iterativo, ossia 
fornisce una successione che si dimostra essere convergente ad una matrice triangolare 
superiore sotto opportune ipotesi. 

Lemma 6.1. Sia A^ una successione di matrici in C n convergente ad I . Se A^ = 
QkRk e una fattorizzazione Q1Z, allora esiste una successione di matrici di fase Sk tali 
che 

lim QkSk = I = lim SkQk-, lim RkS* k = I = lim S^Rk 

fe^+oo k^+oc k^+00 k^+00 



6.3. II metodo Q1Z per la ricerca degli autovalori 
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Dimostrazione. Poiche gli elementi di Q k hanno modulo limitato, si ha 
0= lim {Q k R k -I) = lim Q k (R k - Q* k ) = lim (R k -Q* k ). 

fc^+oo k^+oo fc^+oo 

Essen do R k triangolari superiori, risulta \im k ^ +OQ Qkij = per i < j; pertanto q kii ^ 
per k > N. Posto tp\ k ^ = qku/\Qku\ 1 & tesi e dimostrata deflnendo S k come le matrici tali 

die su = ipf\ \ Q ED \ 

Teorema 6.4. Sia A e C n,n con autovalori \, i — 1, . . . , n, distinti in modulo, doe 

| Ai| > |A 2 | > • • • > |A„| > 0. 

Sia X G C n ' n tale che A = XDX^ 1 , con D diagonale. Supponiamo che esista una 
fattorizzazione CIA di X^ 1 . Allora esiste una successione di matrici di fase {S k } ke ^ tale 
che 

lim £%RWS k - 1 = T= lim S^A^S^, 

k~ »+oo fc^+oo 

lim SUQ {k) S k = I, 

dove T e triangolare superiore. 

Se A e hermitiana, allora T e diagonale. 

Dimostrazione. La dimostrazione si basa sul confronto di due fattorizzazioni Q1Z 
della matrice A k (potenza k-es. di A, da non confondere con A^\). 
Prima fattorizzazione Q1Z. Si ha 

A k = H k U k , H k = . . . q« Uk = . . . rW. 
Infatti, per induzione, si ha A = Q^R^\ e 

H k+1 U k+1 = QU--.Q^R^-.-RU 
= Q^---Q^A^R^---R^ 

= qw...aWqWrW---rw 
= aqw...qWrW...rM 

= AA k = A k+1 . 

Seconda fattorizzazione Q1Z. Posto X 1 = LU, si ha 

A k = XD k w = xD k LD' k D k U, 
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dove risulta 

(D LD )ij =L i = j 

(0 i<j 

Pertanto si puo scrivere D k LD~ k — I + E k , dove lim fc ^ +00 E k = O. Se X = QR e una 
fattorizzazione Q1Z di X, si puo scrivere 

A k = QR(I + E k )D k U = Q(I + RE k R- 1 )RD k U = (QP k )(T k RD k U), 

dove I + RE k R~ l = P k T k e una fattorizzazione Q1Z. 

Confronto tra le due fattorizzazioni. Usando il teorema 5.3, esistono matrici di 
fase <E»fc e U (n, C) tali che 

H k = (QP k M, U k = $ k (TkRD k U). 

Pertanto si ha 

Q« = H k \H k = ^P^P^l 

i? (fc) = U k U k \ = ^RDR-'T-^l^. 

Applicando il lemma 6.1 alia successione P k T k si ottengono matrici di fase F k tali che 

dcf 

\mv k ^ +00 P k F k = I, liuifc^+oo F k T k = I. Si ponga S k = $ k F k . Si ottiene la tesi con 

t = rdr-\ mm 

Per ridurre il numero delle operazioni effettuate con il metodo Q1Z, si effettua una 
preliminare riduzione della matrice A, secondo l'algoritmo seguente. Esiste una matrice 
di Householder Q tale che (QA)n = per % > 2. Si ripete il metodo sulla seconda colonna 
di QA, e cosi via fino ad ottenere una matrice di Hessenberg superiore. E facile rendersi 
conto del fatto che, se A e hermitiana, allora la matrice di Hessenberg superiore cosi 
ottenuta e, in realta, una matrice tridiagonale. 

Altri metodi permettono di valutare il numero di iterazioni del metodo Q1Z necessarie 
ad ottenere una matrice triangolare con la precisione richiesta. Varianti del metodo 
considerano l'utilizzo di matrici di Givens, ed anche matrici elementari di Gauss. Per 
maggiori informazioni, si veda [5, 22]. 



CAPITOLO 7 



DECOMPOSIZIONE AI VALORI 
SINGOLARI ED APPLICAZIONI 



7.1 Premesse 

Si consideri una matrice A e C m,n . I seguenti teoremi caratterizzano le situazioni in 
cui rg(A) = n o rg(A) = m. 

Teorema 7.1. Sia A una matrice di C m ' n . Le seguenti affermazioni sono equivalenti. 

1. AX = O ha Vunica soluzione X = O. 

2. Le colonne di A sono linearmente indipendenti. 

3. rg(A) = n. 

4- A* A e C n ' n e invertibile, quindi rg(A*A) = n. 

Dimostrazione. Le equivalenze tra i primi tre punti sono gia note [16]. 
(4) =^ (1) Se AX = O, allora A* AX = A*0 = O e quindi Tunica soluzione h X = 
per la (4). 

(1) =^ (4) Sia (A*A)X = O e poniamo AX = (y x . ..y m ) T . Allora \yi\ 2 -\ h \y m \ 2 = 

(AX)*(AX) = X*{A*AX) = O, dunque Vi = per i = 1, . . . , m, da cui AX = O e Tunica 
soluzione X = O per la (1). Quindi (A*A)X = O implica X = O e rg {A* A) = n. H 

Teorema 7.2. Sia A una matrice di C m ' n . Le seguenti affermazioni sono equivalenti. 

1. AX = B ammette soluzione per ogni B e C m . 

2. Le colonne di A generano C m . 

3. rg(A) = m. 

4- AA* E C m ' m e invertibile, quindi rg(AA*) = m. 

Dimostrazione. Le equivalenze tra i primi tre punti sono gia note. Si consideri (3) 
<^ (4). Posto C = A* G C n,m , Tequivalenza e dimostrata applicando il teorema precedente 
alia matrice C per la quale rg C = rg A = m. \ qed \ 
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Proposizione 7.1. Sia A e C m ' n . Allora le matrici A* A e AA* sono hermitiane e 
semidefinite positive. 

Dimostrazione. La prima affermazione e ovvia. Si consideri una base ortonormale 
di autovettori {ZA- di A* A con associati autovalori {A,} per % = 1, . . . ,n. Si ha 

(AZ<i) ' (AZ j) — (AZ%) AZj — XjZ^ Zj — XjZ{ ■ Zj, 

e per i = j risulta \\AZi\\ 2 = Aj > 0. Si proceda in maniera analoga per AA*. \qed\ 

Si puo dimostrare in generate che se A e C m ' n e B e C n,m , allora le matrici AS e 
I?A hanno gli stessi autovalori non nulli , e con le stesse molteplicita geometriche. Ne 
segue che A* A e AA* hanno gli stessi autovalori non nulli, e con le stesse molteplicita 
geometriche. Mentre puo accadere che sia un autovalore per A* A e non per AA*, o 
viceversa; inoltre rg (A* A) = rg (AA*) = rg A = rg A* 1 . 

Definizione 7.1. Sia A £ C m ' n , e siano {Xi}i=i,..., n gli autovalori di A* A (o AA*). I 

def i — 

numeri oi = yAj sono detti valori singolari di A. 

Si osservi che se A e hermitiana, allora A* A = A 2 , quindi i numeri <jj sono i valori 
assoluti degli autovalori di A. 

Esercizio 7.1. Mostrare che se A & C n,n e non singolare, allora A* A e definita 
positiva. 



7.2 Decomposizione ai valori singolari 

Sia A G C m ' n , con rg A = r. Ordinati i valori singolari non nulli di A cosi: a± > • • • > 
a r , si pone 

/ o~\ 0\ 









0/ 



(7.2.1) 



Teorema 7.3. Sia A e C m ' n ; con rgA = r. Allora la matrice A si fattorizza nel 
modo seguente 

A = PSg*, P e C m ' m , Q e C n ' n , 

dove P e Q sono unitarie e non univocamente determinate, mentre £ e univocamente 
determinata. 

Dimostrazione. Sia {<3i}i=i,...,n una base ortonormale di autovettori di A* A asso- 
ciati agli autovalori {Aj}j = i v .. jn . La matrice Q = (Qi---Q n ) e una matrice unitaria. 
Posto 

Pi = AQi i = 1, . . . , v, 



1 In generale rg (A + B) < rg A + rg B, rg (AB) < min{rg A, rg B} 



7.2. Decomposizione ai valori singolari 
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Pi risulta un versore poiche ||AQj|| 2 = erf. Si completi l'insieme ortonormale {Pi}i=i,..., r ad 
una base ortonormale {P}j=i v .., m di C m , e si ponga P = (Pi • ■ • P rn ). La matrice P e uni- 
taria e risulta A = PEQ*. Infatti, PS = (a 1 P 1 ■ ■ ■ a r P r • • • 0). e AQ = (AQ 1 ■ ■ ■ AQ n ) = 
(<TiPi • • • a r P r • • • 0) da cui la tesi. \qed\ 

Considerata l'applicazione lineare j 'a' C n — > C m indotta da A [16], il teorema assicura 
che si possono scegliere in C n e C m delle basi ortonormali rispetto alle quali l'applicazione 
Ja ha come matrice associata S, che e di tipo diagonale (nel senso specificato in 1.1). 

Esempio 7.1. Sia 

2 i o ' ' Allora A± A 

e gli autovalori sono Ai = 9, A2 = 1, A3 = 0. Si noti che AA T = (45), con gli stessi 
autovalori non nulli di A T A. Si ha <j\ — 3, a 2 — 1, 

g 1 = -^=(iio) T , q 2 = -L(-i io) T , Q 3 = (ooif. 

Usando P = (l/aAAQi si ottiene 
quindi 





La decomposizione non e unica. 
Osservazione 7.1. 



1. La decomposizione ai valori singolari (SVD) si puo considerare come un'estensione 
del teorema degli assi principali a matrici non quadrate. Essa e molto utile in 
svariate applicazioni dell'algebra lineare, per esempio nella compressione e nella 
trasformazione di dati. 

Per le matrici reali quadrate la decomposizione risale a Sylvester nel 1889, la prima 
dimostrazione nel caso generate risale al 1939 ed e dovuta ad Eckart e Young. 

2. La decomposizione ai valori singolari e utile per stimare quanto un sistema lineare 
sia sensibile agli arrotondamenti dei coefficienti. Se <7j sono i valori singolari, la 
frazione c = o\ja r > 1 e detta indice di condizionamento della matrice A: valori 
alti di c segnalano un'alta pericolosita degli errori dovuti agli arrotondamenti. 
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3. L'interpretazione geometrica dei valori singolari e la seguente. Sia /: M n — > M m 
l'applicazione lineare associata ad A. Allora, per SVD, esistono due basi ortonormali 
B = {ui}eB' = {u'i} di W 1 tali che 



f(Ui) 



OiUi 





% = l,...,r 
i — r + 1, . . . , n 



Se (xi) sono le coordinate rispetto a B in IR ra e quelle rispetto a £>' in R m , le 
equazioni di / sono 

Vi = i = r + l,...,m 

Quindi la sfera unitaria S (di dimensione r — 1) di lR r C W a si muta nell'ellissoi- 
de f(S) (di dimensione r — 1) dello spazio R r C W a . I valori singolari sono le 
lunghezze dei vari assi dell'ellissoide, mentre l'indice di condizionamento e legato 
all'eccentricita dell'ellissoide. 

4. Si vede facilmente che A ed A* hanno gli stessi valori singolari non nulli: 

A = PSQ* =>■ A* = QS*P* = Q£ T P*. □ 



Esercizio 7.2. Provare che i valori singolari di A 1 sono i reciproci di quelli di A. 

Esercizio 7.3. Se A e una matrice quadrata, mostrare che \ det A\ e il prodotto dei 
valori singolari di A. 



7.3 Applicazioni 

7. 3. a Sistemi lineari generali 

Si consideri il sistema lineare di m equazioni in n incognite (m > n) espresso da 
AX = B, con A e C m ' n , X e £ n >\ B e C m '\ Se A = PSQ*, ponendo 

Y = Q*X, B = P*B, 

il problema considerato si spezza in due problemi: 

1. risolvere il sistema TY = B, con E matrice diagonale; 

2. risolvere il sistema Y = Q*X, con Q matrice unitaria. 



7.3. Applicazioni 
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1. Se {ai} (i = 1, . . . ,n) sono i valori singolari di A, posto Y — (y± • • -y„) T e B = 
(foi • • • b m ) T si ha 

<jjUj = bj se j < n e <jj ^ 0, 

Oyj = bj se j < n e Oj = 0, 

= bj se j > n. 

II secondo insieme dei valori e vuoto se r = rgA = n; il terzo insieme e vuoto se 
n = m. Dunque 

AX = B compatibile b 3 ■, — per j > r. 

Se r < n, allora la yj associata ad un Oj nullo puo assumere valore arbitrario (per 
j = r + l,...,n). 

2. Poiche Q e invertibile, si ha X = QY, dipendente da, n — r parametri. 



Esempio 7.2. Si consideri il sistema lineare AX = B dove 



2 i o ) ' V -4 / ' 

Tenendo conto dell'esempio 7.1 si ha 
da cui 

y = -^=(-3 - iW2) T , x = (-i-2/i) T . 

v2 



7.3.b La pseudoinversa di Moore— Penrose 

Sia A E C m ' n una matrice che ammette la decomposizione ai valori singolari A 
PSQ*. Siano > • • • > a r i valori singolari non nulli di A. Se 








D (9 N 

1 C (T ,m > n 

0'^ ' 



si pone 



- 1 O o ] - 
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Definizione 7.2. La matrice 

A + = QZ + P* e C n ' m 

si dice pseudoinversa di Moore-Penrose di A. 

Esempio 7.3. Considerando la matrice A dell'esempio 7.1, risulta 

/-1/3 2/3 \ 
A + = 2/3 -1/3 . 

V o o ; 

II nome 'pseudoinversa' e giustificato dal fatto che, seAe invertibile, allora A + = A^ 1 , 
come si puo facilmente verificare. Infatti, in generate risulta 




AA + = (PZQ*)(QZ + P*) = P ^ P*, 
A + A = (QI1 + P*)(PZQ*) =q(q q^J Q*- 



Se A e invertibile allora rg A = n, dunque r = n, quindi AA + = PP* = I, A + A = QQ* = 
I. 

La pseudoinversa puo essere univocamente caratterizzata mediante la richiesta di 
opportune proprieta (come quelle dell'esercizio 7.5). 

Teorema 7.4. Sia A e C n,m . Allora la matrice A + e univocamente caratterizzata 
dalle seguenti proprieta 

AA + A = A AA + = (AA + Y 

A + AA + = A + A + A = (A + A)* 



Inoltre, 



(A + ) + = A (A + )* = (A*) 

(cA) + = c- l A+ (O n , m )+ = O r , 



A = A* => A + = {A + y, 
A 2 = A = A* A + = A, 

e se rg(A) = k, A = BC, con B e C m ' k , C G C k > n , allora A+ = C + B + , dove 

C + = C*(CC*)~\ B + = (B*B)- 1 B*. 

Si noti che alle decomposizioni CIA e QTZ e possibile applicare la proprieta (8). Inoltre, 
esistono fattorizzazioni A = BC dove A + ^ C + B + nel caso in cui non sia verificata 
l'ipotesi sul rango di A. 



7.3. Applicazioni 
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Osservazione 7.2. Se A G C m ' n ha rango massimo n, allora essa ammette un'inversa 
sinistra, ossia esiste una matrice A' G C n ' m tale che A' A = I G C n,n . In tal caso, per il 
teorema 7.1, A* A e invertibile e 

A' = (A* A)- 1 A* = A + , 

ed analogamente nel caso in cui esista un'inversa destra. □ 
Osservazione 7.3. Sia AX = B un sistema lineare (anche non compatibile), e sia 

A = PSQ* G C m ' n 

la decomposizione ai valori singolari di A. Sia rg(A) — r — rg(E). Si scriva C™' 1 = 
C r,i x C n-r,i_ Allora, F G C"' 1 si scrive come 

Y = dove F' G C r ' x , F" G C"""' 1 . 

Ora 

A + B = Q(Z + P*B) = QY, 

avendo posto F = f £ + P*£>. Eseguendo i calcoli, ci si rende conto che la struttura di S + 
fa si che Y" = O. Dunque 

X = A + B & X = QY con Y" = O. 

Dunque, la pseudoinversa di una matrice puo servire a trovare una soluzione di un sistema 
lineare non quadrato, anche non compatibile (come si vedra nel paragrafo 7.4). □ 

Esempio 7.4. Considerando l'esempio 7.2 si ha 

X = A + B = (-1 -2) T 
soluzione del sistema X = QY dove F = (yi, y 2 , 0) T . 

7.3.c La decomposizione polare 

Teorema 7.5. Se A e C n ' n , allora A ammette la decomposizione 

A = GR, 

dove G G C n,n e hermitiana e semidefinita positiva, ed R G C n ' n e unitaria. 

Dimostrazione. Sia A = PSQ* una decomposizione ai valori singolari di A. Inse- 
rendo I — P*P in tale prodotto si ottiene la fattorizzazione 

a = (pj:p*)(pq*). 
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Si verifica facilmente die G = PEP* = PEP 1 (quindi G e simile a S) ed R = PQ* 
hanno le proprieta richieste. \qed\ 

Si vede facilmente che se A = GR, allora A + = R*G + . 
Osservazione 7.4. Analogamente, ponendo 

A = PQ*QY,Q* 

si conclude che A si puo decomporre anche nel seguente modo: A = RH dove H h 
hermitiana e semidefinita positiva ed R e la matrice unitaria prima considerata. 

Si noti che, se det A ^ 0, allora G e definita positiva. La decomposizione del teorema 
precedente prende il nome di decomposizione polare. Questo nome dipende dal fatto 
che essa e analoga alia scrittura tramite coordinate polari di un numero complesso z = 
pe l6 , dove p E IR+ ed e ld e un numero complesso di modulo 1 (con 9 E [0, 2n[) la cui 
moltiplicazione e la rotazione del piano M 2 dell'angolo 6. 

Quest 'analogia puo essere formalizzata come segue. Sia 



Allora l'applicazione lineare 



/:C-C, a + ib~^ b a b ^j (7.3.2) 

e un isomorfismo di spazi vettoriali reali (interpretando C come spazio vettoriale reale) 
tale che f(zw) = f(z)f(w). Ossia, / trasforma la moltiplicazione di numeri complessi in 
moltiplicazione di matrici. Posto a = p cos 6 e b = p sin 6 si ha 

a —b\ _(p 0\ fcosO — sin^ 
b a J \0 p J ysinO cos 6* 

dove (o p) 6 una matrice semidefinita positiva (definita positiva se z ^ 0) e cose) 
e una matrice ortogonale (corrispondente alia rotazione di angolo 9). 

Osservazione 7.5. Si noti che l'isomorfismo (7.3.2) non commuta con l'isomorfi- 
smo (4.3.9). In altri termini, l'isomorfismo (7.3.2) non coincide con l'isomorfismo (4.3.9) 
sui numeri complessi visti come sottoinsieme dei quaternioni mediante l'inclusione C C 
H (4.3.8). Ci si puo rendere conto di questo anche osservando che la rotazione del piano 
complesso indotta da un numero complesso di modulo 1 mediante l'isomorfismo (7.3.2) 
e diversa dalla rotazione indotta dallo stesso numero mediante la parametrizzazione di 
Cayley-Klein. 



7.3. Applicazioni 
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7.3.d La radice quadrata di una matrice 

Sia A una matrice hermitiana definita positiva. Per il teorema spettrale, A = U*DU, 
dove D e diagonale con elementi non nulli positivi ed U unitaria. Indicata con E 2 la 
matrice delle radici quadrate dei valori singolari (uguali, in questo caso, agli autovalori di 
A), quindi E 2 = E = D, si pone 

y/A = U*E 2 U; 

\[A e detta radice quadrata di A. La denominazione e giustificata dal fatto che 

(VI) 2 = ([/*E 2 [/)([/*E 2 [/) = A. 

Analogamente si definisce \fA = f dove E^ e la matrice costruita come E 2 con le 
radici /c-esime degli autovalori al posto delle radici quadrate. 

Naturalmente, i risultati riportati si possono riformulare in termini di applicazioni 
lineari. 



7.3.e Norma spettrale 

Data A G C m,n , si chiama norma spettrale la norma naturale indotta dalla norma 
vettoriale euclidea, ossia 

|p ||| 2 = sup " " , I e C"' 1 . 
x^o ||A|| 2 

Teorema 7.6. Sia A e C m ' n . Allora |||A||| 2 e uguale al massimo valore singolare di 

A, ossia 

1 1 1 -4 1 1 1 2 = 0-1 = \Al, 

dove Ai e il massimo autovalore di A* A. 

Dimostrazione. Sia A = PHQ* una decomposizione ai valori singolari, con E come 
in (7.2.1). Essendo P unitaria si ha ||PF|| 2 = ||F|| 2 per ogni Y € C" 1 ' 1 , quindi 

||AX|| 2 = \\PZQ*X\\ 2 = \\XQ*X\\ 2 = ||EZ|| 2 , 

dove Z = Q*X = (z-y, . . . ,z n ) T . Al variare di X nell'insieme dei vettori di norma 1, il 
vettore Z assume tutti i possibili valori nell'insieme dei vettori di norma 1. Dunque 

|||A||| 2 = sup{||EZ|| 2 | \\Z\\ = 1}. 

Ma 

\\EZ\\ 2 2 = a\\z x \ 2 + ■■■ + a 2 r \z r \ 2 < a\{\z x f + ■■■ + \z r \ 2 ), 
L'espressione ||EZ||| raggiunge il suo massimo in Z — (1, 0, . . . , 0) T , pertanto 
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da cui la conclusione. \ Q ED 
Osservazione 7.6. Essendo P e Q matrici unitarie, si ha anche 

\\A\\2 = \\n\2=(i2°? 

\i=i 

II nome norma spettrale e giustificato osservando che, detto raggio spettrale di M G 
£n,n jj num ero reale 

p(M) = f max{|A| | A autovalore di M}, 

risulta 

\\\A\\\ 2 = y^A). 

Si noti che se A e hermitiana, allora |||A|||2 = p{A). 

II seguente teorema mostra che per una data matrice A ogni norma matriciale e 
collegata al raggio spettrale di A. 

Teorema 7.7 (Hirsch). Siano A G C n ' n , e \\\ ■ ||| una qualunque norma matriciale 
che soddisfi la (1.2.2). Allora p{A) < \\\A\\\. 

Dimostrazione. Sia A un autovalore di A di modulo massimo ed X G C™' 1 un 
autovettore di A relativo a A. Si consideri la matrice M = (X x . . . X n ), con X* = X per 
i — 1, . . . , n. Allora 

AM = (AXi . . . AX n ) = AM, 

percio 

p{A) HI M||| = |A| HI M||| = |||AM||| = |||AM||| < \\\A \\\ \\\M \\\ . 
Poiche X ^ O segue M/Oe |||M||| > 0, da cui la tesi. BH 

Ne segue che se A e hermitiana allora |||A||| 2 < |||^4|||- 

II teorema precedente giustifica anche l'interesse della norma spettrale in calcolo 
numerico. 




7.4 II metodo dei minimi quadrati 

II metodo dei minimi quadrati ha larga applicazione nella soluzione di sistemi lineari i 
cui coefficienti provengono da dati sperimentali. Per gli errori nelle misurazioni si possono 
trovare equazioni tra loro incompatibili, mentre teoricamente le equazioni corrispondenti 
ai dati, non affetti da errori, devono avere una soluzione. La soluzione secondo i minimi 
quadrati approssima la soluzione "ideale" del sistema non affetto da errori. 

Sia A = (aij) G C m,n , e si consideri il sistema lineare AX = B, con B G C™' 1 . Allora, 

posto U = f £(Ci, . . . ,C„), dove A = (Ci, . . . ,C n ), il sistema e (si veda [16]): 
• compatibile se e solo se B G U, o, equivalentemente, B = Bu\ 
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• incompatibile se e solo se B ^ U, o, equivalentemente, B ^ Bu, 

dove Bu e la proiezione ortogonale del vettore B sul sottospazio vettoriale U. Si introduce 
la funzione 

/: C 1 ' 1 — > R, /(X) ^pX-Ef, (7.4.3) 

detta scarto quadratico medio. L'idea e di rendere minima la funzione /. Tenendo conto 
della disuguaglianza di Bessel A.l, i vettori X che minimizzano / sono quelli per cui 
AX = Bu. La ricerca di tali vettori X e detta metodo dei minimi quadrati. II numero 
\\B — Bjj\\ 2 e detto minimo scarto quadratico medio. 
L'insieme 

Mm A (B) ={X G C n | AX = B v } 

e detto insieme delle soluzioni approssimate del sistema AX = B. 
Teorema 7.8. 

Z G Mm A (B) A*AZ = A*B. 

Dimostrazione. Se Z G Mm A (B), allora B — B v = B — AZ G U ± . Cioe 5-AZe 
ortogonale ad ogni vettore AX G U, quindi 

= (AX) ■ (B - AZ) = (AX)*(B - AZ) = X*A*(B - AZ) = X ■ A*(B - AZ). 

In altre parole, A*(B — AZ) e ortogonale ad ogni X G C n (quindi anche a se stesso), per 
cui 

A*(B - AZ) = O =>■ A*B = A*AZ. 

Vqed\ 

Dal teorema segue che ogni soluzione approssimata Z del sistema AX = B e una 
soluzione esatta del sistema lineare 

A* AY = A*B 

e viceversa. Questo sistema e detto sistema di equazioni lineari normali. Percio ci sara 
una sola soluzione approssimata se e solo se A* A e invertibile, cioe se igA = n (per il 
teorema 7.1). 

Chiamasi soluzione ai minimi quadrati del sistema lineare AX = B ogni vettore 
Z G Mm A (B) tale che 

\\Z\\ < \\X\\ VX G Mm A (B). 

Indichiamo con W = C(R\, . . . , R m ) lo spazio delle righe della matrice A. Come e noto 
(vedi Appendice), 

W = C(C*,...,C*J, 

dove C* sono le colonne di A*. Vale il seguente notevole teorema [32]. 

Teorema 7.9. La soluzione ai minimi quadrati del sistema lineare AX = B e unica e 
coincide con la proiezione Xw su W di un qualunque vettore X appartenente a Min A (B). 
Inoltre essa e data da A + B. 
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Osservazione 7.7. Le matrici AA + e C m,m e A + A e C n ' n sono hermitiane ed idem- 
potenti, quindi matrici di proiezione. Piu precisamente, AA + proietta un vettore di C m 
su P e A + A proietta un vettore di C n su W. Infatti, poiche A + B e soluzione del sistema 
AX = BU, si ha AA + B = BU. Ebbene A + ha l'effetto di mandare prima B su U e poi 
5[/ = AX in X^/, proiezione di X su W. Infatti 

A+B = (A + AA + )B = A + {B V ) = A + AX = X w . 

Esempio 7.5. Dati i punti Pi (0,0), P 2 (l,2), P 3 (3,4), P 4 (4, 6) (non allineati), si ricer- 
ca la retta che approssima in media tali punti nel senso dei minimi quadrati. Se esistesse 
una retta passante per i punti P^ctj,/^), i = 1,2,3,4, di equazione y = a\x + ao, si 
avrebbe 

Oiidi + a = /3i, 
a 2 a x + a = fa, A 
a 3 ai + a = (3 3 , 
0401 + ao = 04, 

Questo sistema non ha soluzioni perche i punti non sono allineati. Si cerca il vettore 
Bjj = aiCi + a C 2 tale che (B — B v ) _L Ci, C 2 . Ora Pt/ = (a , a x + a , 3a! + a , 4ai +a ) T , 
e 



/«! 1^ 




/0 1\ 










a 2 1 




1 1 








2 






3 1 






4 


\«4 1/ 




V 4 V 




w 




V 6 / 



38 - 26ai - 8a = 0, 
12 - 8ai - 4a = 0, 



(P - Bjj) ■ Ci = 0, 
(P - Be) • C 2 = ^ 

da cui si ottiene la soluzione a\ = 7/5, a = 1/5 per cui la retta "ottimale" (nel senso dei 
minimi quadrati) e y = 7/5x + 1/5. 

Naturalmente l'esercizio si puo risolvere anche trovando direttamente A + B. Ora, 
poiche rgA = 2 = n, A + ha la seguente espressione: 



A + = (A* A)' 1 A* 



1 /-4 -2 



20 V 13 9 



2 4 
1 -3 



come si verifica facilmente. Ne segue A + B = (7/5, 1/5) T , come si voleva. 

Quanto detto per trovare la retta "ottimale" si puo ripetere per trovare un polinomio 
"ottimale" di grado al piu n. 

Supposto di aver raccolto m coppie di dati (ctj,/^), % = 1, . . . , to, vogliamo trovare il 
polinomio di grado al piu to che meglio approssima i dati e sia 



p(x) = a n x n + a n _ix 



n-l 



diX + a . 



Imponendo le condizioni p(ai) = si ottiene un sistema lineare di to equazioni nelle n + 1 
incognite a n , . . . , ao- La matrice associata al sistema e del tipo di Vandermonde: 



n-l 


n-l 



a 



1\ 

1 



n-l 



V 
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con X T = (a n , . . . , ao), e B T = (/3i, . . . , /3 n ). Si procede come nel caso generale trovando 
A + B. Se m = n+1, allora det A^0,e quindi si avra una sola soluzione non approssimata 
del sistema (si confronti con l'Appendice). 

Osservazione 7.8. Si e visto che la pseudoinversa di una matrice pud servire a trovare 
soluzioni di un sistema lineare non quadrato (osservazione 7.3). Le soluzioni ottenute sono 
le soluzioni ai minimi quadrati del sistema lineare dato: infatti, basta prendere U = C r , 
jj± _ £n-r e t ener conto di quanto precedentemente esposto. □ 

7.5 Altri metodi per la soluzione del problema dei 
minimi quadrati 

Metodo Q1Z. Sia A G C n ' m , con n > m. Sia igA = m. Si vuole risolvere il 
problema ai minimi quadrati per un sistema AX = B. Si trovi una fattorizzazione Q1Z 
di A procedendo come in 5.9, con Q ed R come in (5.9.11). Allora 



\\AX - B\\ 2 = \\QRX - B\\ 2 = \\Q(RX - Q*B)\\ 2 = \\RX - C\\ 2 , 

dove si e posto C = Q*B. Scrivendo C = (d,C 2 ) T , con C x G C m e C 2 G C n ~ m , e 
R = (Ri, 0) T , con i?i G C m ' m , risulta 



poiche il sistema R\X = C\ ammette una soluzione e questa rende nulla la norma. 

Metodo CC* . Sia A G C n ' m , con n > m. Sia igA = m. Allora, come e facile 
dimostrare, A* A e hermitiana e definita positiva, quindi e possibile applicare il metodo 
CC* per risolvere il problema ai minimi quadrati. II numero di operazioni effettuate e 
inferiore a quello del precedente metodo, ma diventa uguale se m = n. 

Osservazione 7.9. In generale non vi e una relazione semplice tra gli autovalori 
(di una matrice quadrata) ed i suoi valori singolari. In teoria i valori singolari di A si 
possono trovare risolvendo il problema degli autovalori per la matrice hermitiana A* A, 
ma questo procedimento, in pratica, pud portare ad una perdita di accuratezza. Una 
procedura numerica piu stabile consiste nel ridurre, mediante trasformazioni ortogonali 
di tipo Householder, la matrice A ad una matrice bidiagonale e nell'applicare a questa il 
metodo Q1Z. 

7.6 Esercizi di riepilogo 

Esercizio 7.4. Trovare la decomposizione polare di A = ( 22 )- 





min (HiiiJf - Ci||l + HCalll) 
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Esercizio 7.5. Se A e C m ' n , verificare che 

1. AA + e A + A sono hermitiane ed idempotenti; 

2. AA+A = A e A+AA+ = A+ . 

Esercizio 7.6. Indicata con C + la pseudo-inversa di C , provare che 

CC + C = C. 

SOLUZIONE. Se C = PY.Q* e una decomposizione ai valori singolari di C, la sua pseudoinversa e 
C + = QT, + P* . Segue, col simbolismo usato nelle dispense, 



CC+ =PSQ*(QS+P*) = P^ ^jP* 



and 

CC+C = (CC+)C = PEQ* = C. 



□ 



Esercizio 7.7. Se A e una matrice (hermitiana) definita positiva, mostrare che gli 
autovalori di A sono i valori singolari di A. 

SOLUZIONE. Se A e hermitiana, allora A = A* e quindi A* A = A 2 . Se A e un autovalore per A, 
allora A 2 c un autovalore per A* A e a/A 2 = |A| = a e un valore singolare per A. Ma A e definita positiva, 
quindi A > c <r = A. □ 

Esercizio 7.8. Si consideri la matrice 

1/2 6 



5 V 6 7 

1. Determinare una decomposizione a valori singolari di A. 

2. Determinare una forma polare di A. 

SOLUZIONE. 1. Poichc A = A T , i valori singolari di A coincidono con i suoi autovalori presi 
in valore assoluto. Gli autovalori di A sono Ai = 11/5, A 2 = —2/5, quindi o\ = 11/5, o 2 = 2/5. 
D'altra parte gli autovalori di A T A — A 2 sono fii = 121/25 e ^2 = 4/25. 

Vim) - {(x, y)\y = 3/24 - £(00, dove Q 1 



A3 V 3 

Vim) = {(x, y)\y = -A/2x} - C(Q 2 ), dove Q 2 = ^ 2 
Ora, P 1 = 1/aiAQt c P 2 = l/a 2 AQ 2 . 

Poiche o\ e autovalore per A, allora AQi = a\P\, dunque P\ = Q\. 
Poiche a 2 e autovalore per A, allora AQ 2 = <r 2 P 2 , dunque P 2 = —Q 2 . 
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T 



A = P£Q 



Quindi 



2. A = P£Q T = (PEP T )(PQ T ) da una forma polare poncndo 

P£P T = G = ^- \?' ^ ] hcrmitiana e def. positiva, 



65 154 107 



vr - 1 /-5 12 



PQ = P = — ^ 12 _ 5 J unitaria. 

□ 

Esercizio 7.9. Siano A e C n ' n e ||| • ||| una qualunque norma matricide indotta. 

1. Si dimostri che vale I'implicazione 

lim =0 p{A) < 1. 

2. iSia |||A||| < 1. Si dimostri che la matrice I + A e invertibile e che vale la disugua- 
glianza 

\\\(I + A)- 1 \\\< Y -^ m . 

SOLUZIONE. 

1. Risulta \\\A k \\\ > p(A k ) = p(A) k (l'ultima uguaglianza viene dal teorema di Schur). 

2. Poiche p(A) < \\\A\\\ risulta p{A) < 1. Ma supponcndo che sia un autovalorc di / + A si 
giunge ad una contraddizione (fornire i dettagli), dunque I + A e invertibile. Dalla relazione 
(I + A)(I + A)^ 1 = I si ottiene la disuguaglianza 

iii(/+Anii<i+ipiii iiKz+^mi, 

da cui la tesi. 

□ 



CAPITOLO 8 



MATRICI POLINOMIALI 



In questo capitolo daremo le prime nozioni sulle matrici polinomiali, largamente usate 
nello studio dei sistemi di controllo con piu ingressi ed uscite. 

8.1 Premesse 

Definizione 8.1. Sia K un campo (in particolare IK puo essere uno dei campi Q, R, 
C, Zp). 

Una matrice polinomiale A(z) e una matrice del tipo 

A(z) = A + A 1 z H h A h z h , 

dove A p G K m ' n per p = 0, 1, . . . , h. 

Alternativamente si puo defmire una matrice polinomiale come un elemento A{z) G 
K m ' n [z]. Ponendo A p = (a$) si ha 

/ \ (0) . (1) . (h) h 

a ij( z ) = a ij +a\/z + --- + al/z , 

cioe gli elementi della matrice A(z) sono polinomi in z, in simboli dij{z) G K[z]. In altre 
parole, vale l'isomorfismo canonico 

K m ' n [z] ~ K[z] m ' n , 

dove K[z] e l'anello dei polinomi con coefficienti in IK. 

Esempio 8.1. Si consideri la matrice A(z) G lR 2,2 [z] cosi definita 

A(z) = A + A x z 

Allora 
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Una matrice A(z) G K n,n [z] e singolare se il suo determinante e il polinomio nullo. In 
caso contrario si dice non singolare. 

Esempio 8.2. 

• La matrice del precedente esempio e non singolare, poiche det A(z) = 1—32; non e 
il polinomio nullo (anche se la matrice A(l/3) ha determinante nullo). 

• La matrice 

B{z)=( Z ~\ Z l\ 
K ' \z — 1 z + 1 

e ovviamente singolare: det B(z) = identicamente (cioe per ogni z). 

Una matrice A(z) G K[z] m ' n ha rango r se i determinanti dei suoi minori di ordine 
r + 1 sono polinomi identicamente nulli, mentre esiste almeno un minore di ordine r con 
determinante non identicamente nullo. 

Indichiamo con Dk(z) il massimo comun divisore 1 (monico) di tutti i determinanti dei 
minori di ordine k di A(z). Si prova che Dk(z) divide Dk+i(z), in simboli Dk(z) \ Dk+i(z). 
I polinomi 

d^) = ^j- v k>l (8.1.1) 

si chiamano fattori invarianti di A(z). Per definizione si pone D (z) = 1. 
Esempio 8.3. Si consideri il seguente blocco di Jordan di ordine r 



A(z) 



(z-zq 1 ... \ 

z -zo 1 ... 

... z-z 1 

\ ... z-zqJ 



I minori di ordine 1 sono 0, 1, z — z , quindi di(z) = 1. Cos! procedendo risulta dk(z) = 1 
per k < r e d r (z) — (z — z ) r . 

La nozione di rango di una matrice si presta ad una immediata interpretazione in 
termini di "spazi vettoriali" , anche se K[z] e un anello ma non un campo. Se pensiamo alle 
colonne della matrice A(z) G K[^] m ' n come a vettori in K[z] m , il rango di A(z) rappresenta 
la dimensione del sottospazio di K^]" 1 generato dalle colonne di A(z); analogamente si 
prova che rg(A(z)) e uguale alia dimensione del sottospazio vettoriale di K[z] n generato 
dalle righe di A(z). 

Esempio 8.4. Sia 



A(z) 



z+1 z z +2 

z 2 - 1 z 2 - z z 2 + z - 2 



1 Ricordiamo che d(x) e massimo comun divisore di f(x) e g(x) se d(x)\f(x), d(x)\g(x) e per ogni d'(x) 
tale che d'(x)\f(x), d'(x)\g(x) si ha d'(x)\d(x). L'algoritmo di Euclide permette di trovare i massimi 
comun divisori. 
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Si prova facilmente die i minori di ordine 2 hanno determinante identicamente nullo, 
quindi il rango di A(z) e 1 in M[z\. Infatti le due righe sono proporzionali in M.[z] (il 
coefficiente e z — 1). Ovviamente le due righe non sono proporzionali rispetto ad IL 

Le colonne di A(z) generano un sottospazio di M[z} 2 di dimensione 1 su M[z\: un 
generatore e il vettore (1 z — 1) T . Infatti 



z + 1 
z 2 -l 



+ 



1 

z-l 



z 2 — z 



1 

z-l 



z + 2 
z 2 + z-2 



(z + 2) 



1 

z-l 



l 3 di dimensione 1 su 



un 



Le righe di A(z) generano un sottospazio di 
generatore e il vettore (z + 1 z z + 2). 

Definizione 8.2. Si definisce matrice polinomiale elementare una matrice di uno dei 
tre tipi seguenti (si confronti con (5.2.8), (5.2.9), (5.2.10)): 



Ei(z) 



E 2 (z) = 



E 3 (z) = 




Mi(\), 



.. 


. ... 


1 ... 







.. 


. 1 ... 


... 







\o .. 


. ... 


... 






/I .. 


. 






0\ 


.. 


1 









.. 


• p(z) 


... 1 







\o .. 









V 



\.1.2) 



(8.1.3) 



= Sij{p{z)), 



(8.1.4) 



dove AeK \ {0} e p(z) G K[z}. 

Le matrici polinomiali elementari hanno alcune importanti proporieta. Innanzitutto, 
per i — 1, 2, 3, det E i e una costante non nulla quindi Ei e invertibile per ogni z e la sua 
inversa e dello stesso tipo. 

Se A(z) E K[z] p > m ed E^z) E K[z] m > m , allora A(z)E i (z) E K[z] p > m e una matrice 
ottenuta da A(z) mediante trasformazioni elementari sulle sue colonne; analogamente se 
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Ei(z) G K[2;] p ' p allora Ei(z)A(z) G K[z] p ' m e una matrice ottenuta da A(z) mediante 
trasformazioni elementari sulle sue righe. 



8.2 Forma canonica di Smith 

Siano A(z) e B(z) due matrici polinomiali in K[z] p ' m ; diciamo che A(z) e equivalente 
a B(z), in simboli 

A{z) ~ B(z) 

se A(z) puo essere ottenuta da B(z) attraverso una successione di operazioni elementari 
realizzate sia sulle righe sia sulle colonne. In altre parole, A(z) ~ B(z) se esistono matrici 
elementari E t G K[z] p ' p , E'- G K[z} m ' m tali che 

E k (z) ■ ■ ■ E 1 (z)B(z)E' 1 (z) ■ ■ ■ E' h {z) = A(z). 

La relazione introdotta e una relazione d'equivalenza nell'insieme delle matrici K[z] p ' m , che 
viene cosi suddivisa in classi di equivalenza in K[z] p,m / ~. Come di consueto si desidera 
trovare un rappresentante distinto per ogni classe di equivalenza che sia rappresentativo. 
II seguente teorema assicura l'esistenza di una matrice (rettangolare) di tipo diagonale in 
ogni classe d'equivalenza. 

Teorema 8.1 (Forma canonica di Smith). Ogni matrice A(z) G IK^'" 1 e equi- 
valente ad una matrice D{z) G K[,2] p ' m di tipo diagonale, dove 

D(z) = diag(di(z), . . . , d r (z), 0, . . . , 0), 

essendo r = ig(A(z)) e dk(z) i fattori invarianti di A(z). 

Gli elementi r e dk(z) (k — 1, . . . , r) sono univocamente individuati, per cui e unica la 
forma di Smith di una data matrice. Pero le matrici che intervengono nella decomposizione 
non sono univocamente individuate. 

Esempio 8.5. Sia 

' z — 1 z 
z + 1 z-l! ' 



A{z) = 



1 minori di ordine 1 di A{z) sono z — 1, z, z + 1, dunque D 1 (z) = 1. II minore di ordine 

2 ha determinante 1 — 3z, dunque D 2 (z) = 1/3 — z. Dunque 

d ^ ) = DW) = ' d2iz) = ^) =1/3 - Z > 
e la forma canonica di Smith e 

dm-' 1 



1/3- zj' 
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8.3 Matrici unimodulari 

Definizione 8.3. Una matrice U(z) G K[z] m ' m si dice unimodulare se e invertibile 
e la sua inversa U(z)^ 1 = U^^z) e a sua volta una matrice polinomiale, cioe anche 
U^{z) G K[z] m ' m . 

Le matrici unimodulari sono quindi gli elementi invertibili nell'anello non commutativo 
delle matrici quadrate polinomiali; cioe svolgono il ruolo di +1 e —1 dell'anello Z. 
Valgono le seguenti caratterizzazioni. 

Teorema 8.2. Sia U(z) G K[z] m ' m . Sono equivalenti le seguenti affermazioni: 

1. U(z) e una matrice unimodulare; 

2. det U (z) e un polinomio costante non nullo; 

3. la forma canonica di Smith di U(z) e I m ; 

4- U{z) e esprimibile come prodotto di matrici elementari. 
DlMOSTRAZIONE. 

1^2 Da Uizpiz)' 1 = I risulta detU(z) ■ det U(z)- 1 = 1. Essendo gli unici elementi 
invertibili in K[z] le costanti non nulle, si ha la tesi. 

2 3 Considerando la forma canonica di Smith, U (z) e l'unico minore di ordine m, 

quindi det U(z) coincidera a meno di una costante moltiplicativa con d\{z) ■ ■ ■ d m (z). 
Ma essendo det U(z) una costante non nulla e di(z) polinomi monici si ha di(z) = 1 
per tutti gli i. 

3 ^> 4 Essendo 

E k (z) ■ ■ ■ E 1 (z)U(z)E[(z) ■ ■ ■ E' h (z) = I m , 

risviltjct 

U(z) = E 1 (z)- 1 ■ ■ ■ E k {zy l E' h {zy l ■ ■ ■ E[{z)-\ 
da cui la conclusione poiche le inverse di matrici elementari sono elementari. 

4 => 1 Poiche il determinante di matrici elementari e una costante, anche le inverse sono 

matrici polinomiali e quindi U(z)^ 1 e polinomiale. 

Vqed\ 

Poiche ogni matrice A(z) e equivalente ad una matrice D(z) segue il corollario. 

Corollario 8.1. Data una matrice A(z) G K[,2] p ' m 7 esiste una coppia di matrici 
unimodulari U{z) G K[z] p > p e V(z) G K[z] m > m tali che 

D(z) = U{z)A(z)V{z). 
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Ovviamente, poiche U(z) 1 e V(z) 1 sono unimodulari si ha U(z) 1 D(z)V(z) 1 = 
A(z). 

Esercizio 8.1. Dedurre che la seguente matrice e unimodulare, verificando diretta- 
mente le proprietd 1-4 del teorema precedente: 



A(z) 



(\ -z 2\ 

10 

-3z 1 z 

\0 1/ 



CAPITOLO 9 

ESPERIMENTI NUMERICI CON OCTAVE 



In questo capitolo saranno approfonditi mediante esempi numerici alcuni temi della 
teoria sviluppata in precedenza. II programma usato e octave, che puo essere liberamente 
copiato dal sito http://www.octave.org/. In particolare e suggerita ai lettori un'analisi 
del codice sorgente di octave per quanto riguarda gli argomenti trattati nel corso. Ci 
si puo rendere conto di come le librerie usate per implementare gli algoritmi presentati 
vengano quasi tutte dal pacchetto lapack, reperibile in http://netlib.org. 

Esempio 9.1. Scrivere una funzione che crei una matrice triangolare superiore di 
numeri casuali compresi tra e 100 di ordine n. 

SOLUZIONE. 

function a=mat_sup(n) 
a=zeros(n); 
for j=l:n 
for i = l:j 

a(i,j)=floor(100*rand(l,l)); 
end 
end 
endfunction 

Problema 9.1. Scrivere una funzione che crei una matrice tridiagonale di ordine n 
che ha 2 sulla diagonale principale e — 1 sulle altre. 

Esempio 9.2. Scrivere una funzione di due variabili che risolva un sistema con 
matrice triangolare superiore. Iniziare la funzione con un test sulle variabili. 

SOLUZIONE. 

function x=tri_sup(a,b) 

% Controlla le dimensioni di a: 

[n,m] = size(a); 

if m~= n 

printf('A non e" quadrata') 

return 

end 

for i=l:n 

for j=l:i— 1 
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if a(i,j)~=0 

printf ( ' A non e" triangolare superiore') 
return 

end 

end 

end 

% Controlla le dimensioni di b: 
if length(b) ~= n 

printf ( 'B non e" compatibile') 

return 

end 

% Risolve il sistema 
x(n) = b(n)/a(n,n); 
for i=n— 1:— 1:1 

somma=b(i); 

for j=i+l:n 

somma = somma — a(i,j)*x(j); 

end 

x(i) = somma/a(i,i); 

end 

Esempio 9.3. Scrivere un programma che confronti la velocita del metodo di fatto- 
rizzazione OA con il metodo di fattorizzazione QTZ usando matrici quadrate casuali di 
dimensione sufficientemente grande. 

SOLUZIONE. 
index=0; 

for n=10:100:1000 
index=index+l; 
a=rand(n,n); 
tO=cputime; 
[l,u]=lu(a); 

printf (" fattorizzazione LU per n=%d :",n) 

cputime— tO 

tl=cputime; 

[q,r]=qr(a); 

printf (" fattorizzazione QR per n=%d :",n) 
cputime— tl 

end 

Problema 9.2. Scrivere un programma che confronti la velocita di risoluzione di un 
sistema triangolare superiore usando, rispettivamente, lafunzione delV esercizio precedente 
e lafunzione di 'divisione matriciale' di Octave. 

Problema 9.3. Scrivere una funzione di due variabili (matrice incompleta e termine 
noto) che risolva un sistema con matrice triangolare inferiore. Iniziare la funzione con 
un test sulle variabili. 
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Esempio 9.4. Scrivere una funzione di due variabili (matrice incompleta e termine 
noto) che risolva un sistema lineare a matrice quadrata con il metodo di eliminazione. 
Alia fine, si usi la funzione 'trLsup'. 

Si applichi la funzione al sistema lineare AX = B dove 



A = 



(-2 


4 


-1 


-A 




(12\ 


4 


-9 





5 


, B = 


-32 


-4 


5 


-5 


5 


3 


V-8 


8 


-23 


20 J 




\ 13 / 



SOLUZIONE. 

function x=ris_sistema(a,b) 

% 

n=size(a,l); 
a=[a,b] 

% Test per I ' esistenza di un ' unica soluzione 

% 

for k=l:n— 1, 
rigaprimo=k; 
p(k)=k; 
if a(k,k) == 

for i=k+l:n, % scelta pivot (parziale) 

if a(i,k) != 0, 
rigaprimo = i; 
else 

printf('Il sistema non ha un'unica soluzione, passo k=%d',k) 
return 
end 
end 
end 
% 

if k != rigaprimo, % Eventuate scambio righe 
for j=l:n+l, 

tmp=a(k,j); a(k,j)=a(rigaprimo,j); a(rigaprimo,j )=tmp; 
end 
end 

for i=k+l:n, % Calcolo dei moltiplicatori e eliminazione 

aik=a(i,k)/a(k,k); 

a(i,k)=aik; % memorizza il moltiplicatore 

for j=k+l:n+l, 
a(i,j)=a(i,j)-aik*a(k,j); 
end 
end 
end 
% 
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% Copia della parte tr. sup. in U 

% 

utemp=a(:,l:n); 
U=triu(utemp,0); 

% 

% Soluzione con trLsup 
x=tri_sup(U,a(:,n+l)); 
% endfunction 

Si noti che il programma non e in grado di distiinguere tra il caso in cui ci sono infinite 
soluzioni ed il caso in cui il sistema non e compatibile. 

Problema 9.4. Scrivere una funzione che, migliorando la precedente, sia in grado di 
dire se il sistema ha infinite soluzioni o nessuna. 

Problema 9.5. Scrivere una funzione di una variabile (matrice quadrata) che calcoli 
il determinante con il metodo di riduzione ad una matrice triangolare. Si confronti il 
tempo di esecuzione con il tempo di esecuzione della funzione 'det' e con il tempo di 
calcolo del determinante con il metodo di Cramer. 

Problema 9.6. Scrivere una funzione di una variabile che calcoli I'inversa di una 
matrice quadrata con il metodo di Gauss-Jordan. Si confronti il tempo di esecuzione con 
il tempo di esecuzione della funzione l inv '. 

Esempio 9.5. Scrivere una funzione che calcola la fattorizzazione CIA di una matrice 
quadrata (senza pivot). 

Soluzione. 

% La funzione termina con un errore 
% se cV un pivot < EPS*NORM(A) 
function [l,u] = elleu(a) 
nor=norm(a); 

% Controlla le dimensioni di A: 
[n,m] = size(a); 
if m != n 

display('A non e" quadrata') 

return 

end 

l=-eye(n); 
for k=l:n— 1 

if abs(a(k,k)) < eps*nor 

display ( ' Pivot troppo piccolo ' ) 

return 

end 

l(k+l:n,k) = -a(k+l:n,k)/a(k,k); 

a(k+l:n,k+l:n) = a(k+l:n,k+l:n)+l(k+l:n,k)*a(k,k+l:n); 

end 

% Immagazzina i risultati nelle matrici leu: 
1 = -1; 



138 



Capitolo 9. Esperimenti numerici con octave 



u = zeros(n); 
for i=l:n 
for j=i:n 

u(i,j) = a(i,j); 

end 

end 

Esempio 9.6. Calcolare l'inversa della matrice di Hilbert H = (hij), dove 



con i metodi CU, QTZ, SVV. Valutare l'errore commesso con 'norm(H*inv(H)-I)' nei tre 
casi. 

SOLUZIONE. 

% ESERCIZIO: calcolare H=hilb(n) per n=5 e n=10, 

% 

% SOLUZIONE: 

% 

for n=[5 10] 
h=hilb(n); 
[l,u] =lu(h); 
[q,r] = qr(h); 
[uu,s,vv]= svd(h); 
% dimensiona le tre inverse 
hlu = zeros(n); 
hqr = zeros(n); 
hsvd = zeros (n); 

% costruisce I 'inversa per colonne in ognuno dei casi 
for j = l:n 

% costruisce il termine noto, ej 

ej = zeros(n,l); 

ej(j) = i; 
hlu(:,j) =u\(l\ej); 
hqr(:,j) = r\(q'*ej); 
hsvd(:,j) = vv*(s\ (uu'*ej)); 

end 

fprintf('Valore di N %3.0f \n',n); 
disp('Errore nella fattorizzazione LU'); 
nl=norm(h*hlu — eye(n)); 
n2=norm(hlu*h — eye(n)); 
fprintf('%e %e \n',nl,n2); 
disp('Errore nella fattorizzazione QR'); 
nl=norm(h*hqr — eye(n)); 
n2=norm(hqr*h — eye(n)); 
fprintf('%e %e \n',nl,n2); 
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disp('Errore nella fattorizzazione SVD'); 
nl=norm(h*hsvd — eye(n)); 
n2=norm(hsvd*h — eye(n)); 
fprintf('%e %e \n',nl,n2); 

end 

Esempio 9.7. Stimare numericamente 1'andamento del rango della matrice di Hil- 
bert. 

SOLUZIONE. 

for n=l:100 
a=hilb(n); 
r(n)=rank(a) 

end 

r 

Si osservi die, in teoria, la matrice di Hilbert e non singolare, ma il rango 'percepito' dal 
programma e sensibilmente inferiore. E necessario, quindi, aumentare la precisione del 
calcolo in dipendenza dal tipo di dato. 

Problema 9.7. Chiamare la fattorizzazione OA di 




Perche L non e triangolare? 

Problema 9.8. Scrivere una funzione che calcoli la matrice Q di Householder che 
trasforma un dato vettore V in un vettore che ha tutte le componenti successive alia prima 
nulle. 

Problema 9.9. Data la matrice 

(2 1 -1 2 \ 

1 1 3-i 1 + i 

-1 3 + i i 

\2 1-i -i ) 

trovare la matrice con la funzione delV esercizio precedente. Dire se esiste una 
fattorizzazione CC* di A. Trovare (se esiste) una fattorizzazione CC* di A* A. 

Esempio 9.8. Calcolare il rango di una matrice usando il metodo Q1Z. 

Soluzione. Si usi la seguente tolleranza: 

% Sintassi: r=rango(a,tol) 

% tol: precisione di calcolo richiesta . 

function r=rango(a,tol) 

if nargin < 2 

tol=eps*norm(a,l); 



140 



Capitolo 9. Esperimenti numerici con octave 



end 

Si noti che la funzione 'qr' calcola le matrici Q ed R a meno di una permutazione II 
che organizza le righe di R in modo da avere gli elementi della diagonale decrescenti 
in modulo. Si tenga conto del fatto che R sara a scalini nel caso di rango inferiore al 
massimo. 

Esempio 9.9. Date le matrici 



(I 


2\ 




( 2 \ 


1 


3 




1 


2 


1 


, B = 


3 


3 


3 




4 


\6 


3/ 




w 



risolvere con il metodo Q7Z il problema ai minimi quadrati. 
Soluzione. 

function x=min_quad(a,b) 

% Controlla le dimensioni di a: 

[n,m] = size(a); 

p=length(b); 

if p != n 

printf ( ' Termine noto non valido') 

return 
end 

if m > n 

printf ('AX=B non ammette un'unica soluzione ai m.q.') 
return 

end 

% 

[q,r]=qr(a); 
c=zeros(n,l); 
c=q'*b 
for i=l:m 

for j=i:m 
rl(i,j)=r(i,j); 

end 
end 

tn=c(l:m) 
x=rl\tn; 

distanza=c(m+l:n); 
d=norm(distanza); 

printf ("Minima distanza dalla soluzione: %d",d) 
endfunction 

Problema 9.10. Risolvere lo stesso problema usando la fattorizzazione CC* . 
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Esempio 9.10. Scrivere un programma che calcoli gli autovalori di una matrice 
usando il metodo iterativo QTZ. 

Soluzione. Bisogna creare la successione delle iterate QTZ. Non sono state studiate 
le stime per la convergenza del metodo QTZ] si procede in maniera diretta. 

function x=avaLqr(a,iter) 
% Controlla le dimensioni di a: 
[n,m] = size(a); 
if m != n 

printf ('Bocciato :— )') 

return 

end 

% 

x=zeros(n,l); 
for i=l:iter 

[q,r]=qr(a); 

a=r*q; 

if norm(diag(a)— x)< eps 

printf ("Tolleranza raggiunta al passo %d\n",i) 
return 
end 

x=diag(a); 
end 

endfunction 

Problema 9.11. Usando il precedente programma, scrivere una funzione che calcoli 
i valori singolari di una matrice non quadrata. 

Esempio 9.11. Scrivere una funzione che calcoli i cerchi di Gershgorin per una data 
matrice quadrata, per righe o per colonne, e li disegni. 

Soluzione. 

function [r,c]=gersh(a) 

% Controlla le dimensioni di a: 

[n,m] = size(a); 

if m != n 

printf ( 'Bocciato :— )') 

return 

end 

% 

r=zeros(n,l);c=diag(a); 
for i=l:n 

r(i)=sqrt(a(i,:)*a(i ,:)'-( abs(a(i, i )))* 2); 
end 
hold on 

t =(0:0.1:6.3)'; X=cos(t);Y=sin(t); 
for i=l:n 
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[r(i)*X(tt)+real(c(i)),r(i)*Y(tt)+imag(c(i))]; 



for tt=l:64 
data(tt ,:) = 
end 

gplot data 
end 

endfunction 

Problema 9.12. Si pud usare il procedimento seguente per la riduzione del tempo 
di calcolo degli autovalori con il metodo seguente. Sia A e C n ' n non singolare. Posto 
AW = A, sia Pi G C n 1,n 1 la matrice elementare di Householder tale che 



Pi 



( G2l\ 

\a n ij 



M 
o 

w 



Si ponga 



„(!) def ( 1 O 

W " O A 



Allora, si dimostra facilmente che la matrice QW A^Qi 1 ) ha gli dementi della prima 
colonna con indice di riga maggiore di 2 nulli. Iterando il procedimento, si ottiene una 



matrice di Hessenberg superiore, ossia una matrice A^ n 2 ) tale che a[- 



(n-2) 



se i > j + 1. 



La matrice A*™" 2 ) ha, ovviamente, gli stessi autovalori della matrice di partenza. 
Si noti che, se A e hermitiana, allora A^ 2 ^ e hermitiana. 

Dimostrare numericamente che il tempo necessario alia ricerca degli autovalori di 
una matrice A e inferiore se questa e preventivamente ridotta in forma di Hessenberg 
superiore. 

Esempio 9.12. Questo esempio b stato fornito dal Prof. G. Ricci e dall'Ing. F. 
Bandiera. Si tratta di trovare gli autovalori di una matrice C di segnali ed i corrispondenti 
autovettori. Questi dati corrispondono rispettivamente agli utenti in un dato dominio 
UMTS ed al loro segnale. La base teorica di questo esempio si trova in 

II programma. La parte interessante ai fini del corso di calcolo matriciale e quella 
dove si calcolano gli autovalori della matrice C . SI noti che questo esempio e eseguito su 
una matrice di codici data (CodiciGold31). 

% Processing Gain 
Q=31; 

% Numero di utenti 
K=15; 

% Numero di intervalli di simbolo 

% su cui valutare la matrice di correlazione campionaria 
M=400; 

% Rapporto segnale— rumore 
SNR_dB=10; 



% Multiple Access Interference 
MAI_dB=0; 



% Inizializzazione dei generatori di numeri casuali 
% randnf'state \sum( 100* clock)); 
% rand('state ', sum( 100* clock)); 

% Codici di spreading (PN) 
load CodiciGold31; 
S=Gold(:,l:K); 

% Matrice delle ampiezze 
A=zeros(K,K); 

% Ampiezza dell'utente da demodulare 
A(l,l)=l; 

% Ampiezza degli altri utenti 
A(2:K,2:K)=sqrt(10~(0.1*MAI_dB)).*eye(K-l); 
% Varianza dei campioni di rumore 
Sigma_quadro=(A(l)"2)*Q*(10.^((-0.1)*SNR_dB)); 

%%%%% Inizio Costruzione della matrice dati %%%%% 
% Bit dei vari utenti sugli M intervalli 
B=sign(randn(K,M)); 

% segnali trasmessi 
T=S*A*B; 

% rumore termico 

N=sqrt(Sigma_quadro/2)*(randn(Q,M)+sqrt(— l)*randn(Q,M)) 

% matrice dati con rumore 
R=T+N; 

%%%%% Fine Costruzione della matrice dati %%%%% 

% matrice di correlazione campionaria 
C=(1/M)*R*R'; 

% estrazione degli autovalori ed ordinamento 
L=eig(C); 

Aval=flipud(sort(L)) 
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A.l Prodotti scalari hermitiani 

Definizione A.l. Sia V uno spazio vettoriale sul campo C. Si dice che una funzione 



Si noti che un prodotto hermitiano non e bilineare rispetto C per la presenza del 
coniugio in 3. Una funzione (3: V x V — > C che soddisfl le proprieta 1-4 si dice forma 
sesquilineare. La proprieta 5 dice che (5 e autoconiugata. 

Naturalmente, (3(x,x) E H. per ogni x E V . Ne segue che si possono suddividere i 
prodotti hermitiani in prodotti hermitiani (semi)definiti positivi, (semi)definiti negativi, 
indefiniti a seconda del segno di /3(x, x) come per le forme bilineari simmetriche reali [16]. 

Definizione A. 2. Sia V uno spazio vettoriale sul campo C. Un prodotto hermitiano 
f3 si dice prodotto scalare hermitiano se f3 e definito positivo. 

Esempio A.l. In C n si consideri la funzione 



(3: V x V -> C 



e un prodotto hermitiano se: 

1. f3(x + x', y) = fi(x, y) + f3(x', y) per ogni x , x\ y E V; 

2. (3(x, y + y') = P(x, y) + P(x, y') per ogni x , y, y' E V; 

3. P(ax, y) = aj3(x, y) per ogni x, y E V e a E C; 

4. ay) = aj3(x, y) per ogni x, y E V e a E C; 



5. = 



n 



•:C"xC 



C, 




i=l 



Questa e un prodotto scalare hermitiano su C n (dimostrarlo). 

Esercizio A.l. Dire sotto quali condizioni su A E C n,n I ' applicazione 

■:C"xC n ^C,IT = X*AY 



e un prodotto scalare hermitiano. 
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Definizione A. 3. Si dice spazio vettoriale hermitiano uno spazio vettoriale complesso 
dotato di un prodotto scalare hermitiano. 

Buona parte dei risultati sugli spazi vettoriali euclidei valgono senza modifiche sugli 
spazi vettoriali hermitiani. Lo studio della geometria di questi spazi permette di dare 
un'impostazione geometrica a molti problemi di analisi. 

Sia (V,j3) uno spazio vettoriale hermitiano. Se B = {e*i,...,e n } e una base di V, 
posto 

aij = /5(ei,ej) G C, (i,j = l,...,n), 

si dice che la matrice A = (aij) e la matrice associata a (3 tramite B. Si dimostra facilmente 
che A e hermitiana. Le fomule per il cambiamento di base sono simili a quelle per le forme 
bilineari reali. 

Si defmisce la norma di un vettore v G V rispetto a j3 ponendo 

\\v\\^y/P(v,v) >0 

rispetto a (5. 

Si dice che due vettori u,v G V sono ortogonali se /3(u,v) = 0, e si scrive u _L/3 v, o 
anche u _L {T quando non esista possibilita di equivoco. 
Valgono le disuguaglianze di Schwarz e di Minkowski: 

\(3(u,v)\ < IHI/3, 
11^ + ^11/3 < HH/3 + \\v\\ fi- 
ll procedimento di ortonormalizzazione di Gram-Schmidt si puo eseguire come nel caso 
di uno spazio vettoriale euclideo. Dunque, in ogni spazio vettoriale hermitiano esistono 
basi ortonormali. 

Se U e un sottospazio di V, esiste ed e unico il complemento ortogonale U ± di U, e 
vale V — U © U^. Dunque, dato x G V esiste un'unica decomposizione x — xu + Xu±. Se 
{e*i, . . . , e n } e una base ortonormale di V tale che {e\, . . . , e r } e una base di U (una tale 
base esiste sempre, dimostrarlo!), allora (a 7 — xu) -L U implica 

(3((x — Aie*i — • • • — A r e r ), e*j) = per i = 1, . . . , r 

da cui risulta Aj = e,). I coefficienti Aj prendono il nome di coefficienti di Fourier. 

Proposizione A.l (Disuguaglianza di Bessel). Sm nno spazio vettoriale 

hermitiano, ed U C V un sottospazio. Se x E V , allora 

\W\\fi > \\xu\\p. 

Dimostrazione. Infatti, x = xu + Xjj±, dunque per il teorema di Pitagora — 

IWuWfi + \\xuA\fi > \\xu\\% 

In modo analogo si vede che, se y G U, allora d(x, y) > d(x, x*u) dove d(x, y) = \\x—y\\p. 
Dunque, il vettore xu e il vettore di U avente minima distanza da x. 
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Esempio A. 2. Si consideri lo spazio vettoriale V = C°([a, b]) costituito da tutte le 
funzioni continue /: [a, b] — > C. L'applicazione 



P:VxV^C, P(f,g)= / f{x)g{x)dx 

J a 

e un prodotto scalare hermitiano. Infatti si dimostrano facilmente le proprieta della 
definizione A.l. Proviamo ora che (3 e definita positiva. 

P(fJ)= [ b \f(x)\ 2 dx>0 

poiche l'integrando e positive Rimane da provare che f3(f, f) = implica / = 0. Se / 
non e la funzione nulla esistera qualche punto xo in cui f(xo) ^ 0. Essendo / continua, 
ci sara un intervallo (x — e, x + e) in cui f(x) ^ 0, e quindi fl(f, f)^0 contro l'ipotesi. 
La distanza indotta da questo prodotto scalare e 

d(f,g) = \\f-g\\=(j'\f(x)-g{z)\ 2 dx 

detta distanza L 2 , utilizzata nella teoria dei segnali [31]. 

Se /: V — > We un'applicazione lineare (rispetto a C) tra i due spazi vettoriali 
hermitiani (V, f3) e (W, 7), si dimostra che esiste una ed una sola applicazione lineare 
/* : W — > V detta aggiunta di / tale che 

-y(m,y) = P($,f*(y)) Vf e V, Vy e W. 

Rispetto a basi ortonormali, la matrice dell' applicazione aggiunta e la matrice aggiunta 
dell' applicazione di partenza. Inoltre 

V = Imf* ©Ker/, = Im / © Ker /*, 
Im/* = (Ker/)- L , Im/ = (Ker/*) 1 - 

Si osservi che se i e la matrice associata ad /, allora Im/* e lo spazio generato dalle 
righe di A, matrice coniugata di A. 

Un endomorfismo / di uno spazio vettoriale euclideo V con prodotto scalare g si 
dice hermitiano (o autoaggiunto) se / = /*. In questo caso, la matrice rispetto a basi 
ortonormali risulta hermitiana. 

Una trasformazione unitaria di V e un endomorfismo /: V — > U tale che 

/5(/(f),/(f))=/5(x,y). 

La matrice di una trasformazione unitaria rispetto a basi ortonormali e una matrice 
unitaria. 




A. 2. Elementi impropri e spazi proiettivi 
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Esercizio A. 2. Si dimostri che gli autovalori di una trasformazione autoaggiunta 
sono reali. 

Esercizio A. 3. Si dimostri che gli eventuali autovalori di una trasformazione unitaria 
sono numeri complessi di modulo 1. 

Esercizio A. 4. Sia data la matrice 



G 



4 l + 3i 
1 -Si 3 



1. Provare die G e associato ad un prodotto scalare hermitiano g. 

2. Calcolare g(2ei + 3ie 2 , (2 + i)e\ — e 2 ). 

SOLUZIONE. 1. Si prove facilmente che G* — Q T — G. Inoltre i determinanti dci minori 
principali indicano che la G e definita positiva. 

2. Tenendo conto delle proprieta di un prodotto scalare hermitiano si ha 

g(2e 1 + 3ie 2 , (2 + i)e*i - e 2 ) = 2(2 + l^e^ei)- 

2g(e 1 ,e 2 ) - 3i(2 + i)g(e 2 , e\) + 3ig(e 2 , e 2 ) = -1 - 4i 

□ 



A. 2 Elementi impropri e spazi proiettivi 




Figura A.l. 



La figura A.l mostra una corrispondenza tra i punti della 
retta r e le rette del fascio passante per P . Tale corrispondenza e 
biunivoca, a meno di un'eccezione: alia retta r per P e parallela 
ad r non corrisponde alcun punto di r. Per rendere biunivoca 
la corrispondenza diciamo che alia retta ro corrisponde il punto 
all'infinito di r, detto anche punto (o elemento) improprio di r, 
ed indicato con P^. E chiaro che, se r // s, allora s ed r avranno 
lo stesso punto improprio. Quindi punto improprio di una retta 

e sinonimo di direzione. La retta ampliata f = f r U {-Poo} ha un 
solo punto all'infinito, mentre in Analisi R ha due punti all'infinito. 

La retta affine ampliata e anche detta retta proiettiva: essa e 
r in corrispondenza biunivoca con una circonferenza (figura A. 2). 
Da un punto di vista astratto, un fascio di rette e la stessa 
cosa di una retta proiettiva: Tunica 'differenza' e che una retta 
r affine ampliata e generata da un punto, mentre un fascio di rette 
e generato da una retta. Se il fascio di rette e improprio, si puo 
considerare come fascio di rette con centro in un punto impro- 
prio. In questo caso, la corrispondenza biunivoca con una retta e 
molto semplice: basta considerare le intersezioni di una retta non 
appartenente al fascio con le rette del fascio (figura A.3). 
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Dunque, se consideriamo due rette proiettive nel piano, esse 
si incontrano sempre; piu precisamente, 

f D s = Poo =>• r / s, 
f fl s = Pq =>• r incidente s. 

Le direzioni nel piano sono oo 1 ; possiamo dire che esse costi- Figura A. 3. 

tuiscono la retta impropria (figura A. 4). Posto 7f = f 7r U 
considerando un altro piano er puo verificarsi: 

7f n a = =>- 7T / a, 

7f fl a = r =>• 7r incidente a. 

Le usuali coordinate cartesiane (x, y) non sono 
adatte a rappresentare i punti impropri. A tale scopo 
si introducono le coordinate omogenee (xi,x 2 ,x 3 ) G 
M 3 \ {(0, 0, 0)}. Se il punto P e proprio ed ha coordi- 
nate (x,y), ad esso si associa la terna (xi,x 2 ,x 3 ) tale 
che Xi/x 3 = x, x 2 /x 3 = y. Naturalmente x 3 ^ 0. E 
chiaro che si tratta di terne proporzionali. Piu for- 
malmente, si introduce in M 3 \ {(0,0,0)} la seguente 
relazione di equivalenza 

(xi,X2,xz) ~ (x[, x' 2 , x' 3 ) <^ esiste k e M. \ {0} tale che (x±, x 2 , x 3 ) = k(x[, x' 2 , x' 3 ). 

L'insieme quoziente M 3 \ {(0,0,0)}/ ~ rispetto a tale relazione di equivalenza e detto 
piano proiettivo (reale). Ogni punto del piano proiettivo corrisponde ad una classe P = 
[(xi,x 2 ,x 3 )}^ di vettori di coordinate proporzionali. Se x 3 ^ 0, allora P e proprio e le 
sue coordinate cartesiane (x,y) sono date dalle precedenti relazioni. Se x 3 = 0, allora P 
e improprio, ed e individuato da una direzione avente parametri direttori (l,m). Si ha 

r//r' & (l,m)~(l',m') => (I, m, 0) ~ (I', m', 0) Poo = PL- 

Dunque, i punti impropri sono caratterizzati dall'avere x 3 = 0. 

Le coniche ammettono un'interessante caratterizzazione usando la loro intersezione 
con la retta impropria. Una conica C irriducibile e rappresentabile come il luogo degli 
zeri di un polinomio di secondo grado irriducibile. Se r e una retta del piano (propria o 
impropria) risulta r fl C = {A, B}. Consideriamo ora la retta impropria: si ha 

fl C = 2 punti immaginari coniugati =3- C ellisse 

fl C = 2 punti reali distinti =^ C iperbole 

fl C = 2 punti reali coincidenti C parabola 

In questa classificazione si prende come elemento di confronto la retta impropria e non una 
retta propria poiche in un cambiamento di riferimento affine i punti impropri rimangono 




\ 

\ 
\ 

i 

/ 

Figura A. 4. / 



A. 3. Polinomio interpolatore 



149 



impropri (cioe hanno in entrambi i riferimenti la terza coordinata uguale a 0). Infatti, un 
cambiamento di riferimento affine (subordinate da uno proiettivo) e espresso da 

x\ = a 11 x 1 + a 12 x 2 + a 13 x 3 , 
x' 2 = a 2 \X\ + a 22 x 2 + a 23 x 3 , 

x 3 — CL 33 X 3 , 

e ponendo come al solito x' = x[/x 3 , y' = x' 2 /x 3 si ha 

j x' = ax + by + xo, 
\ y' = cx + dy + y . 



A. 3 Polinomio interpolatore 

Sia p(x) G K n [x], 

p(x) = a n x n + a n _ix n ~ 1 + • • • + aix + a ; 

n + 1 condizioni lineari indipendenti sui coemcienti individuano p(x). 

Teorema A.l. Sia {«j}o<j<n una famiglia di numeri reali distinti e sia {/9j}o<j<n 
una famiglia di numeri reali. Allora, esiste un unico polinomio P(x) G M. n [x] tale che 

P(<*i) = Pi- 

Dimostrazione. Le condizioni che P(x) deve soddisfare sono 
a n o;™ + an-io;™ -1 + • • • + a\di + a = Pi, 
per < % < n. Questo e un sistema lineare non omogeneo la cui matrice incompleta e 



A = a\ a r l 



n-l 


n-l 




Si puo dimostrare che 

detA= Y\ («^-«a); 

0<\<fi<n 

questo e il determinante di A. T. Vandermonde (1735-1796). Per le ipotesi, det A ^ 0, 
dunque la soluzione e unica. \ qed \ 

L'interpretazione geometrica del precedente risultato e la seguente. Si dice parabola 
di ordine n la curva algebrica 

y = a + a\x + • • • + a n x n . 
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II teorema precedente, quindi, afferma che fissati nel piano n + 1 punti (xj, yi), con Xi ^ Xj 
se % 7^ j, allora esiste un'unica parabola di ordine n passante per i suddetti punti. 

Si osservi che una funzione f(x) reale, derivabile n volte in un punto, ammette uno 
sviluppo di Taylor di ordine n, ed e quindi approssimabile in un intorno del punto da una 
parabola di ordine n. 

Si consideri ora una funzione f:U C M 2 — > R. Essa, sotto condizioni di regolarita, 
ammette uno sviluppo di Taylor del tipo 

f(x,y) = f(x ,y ) + (f° x (x - x ) + f° y (y - y ))+ 

+ \(fl(x - ^o) 2 + 2f xy (x - x )(y - y ) + f yy {y - y ) 2 ) + ■■■ (A.3.1) 

La superficie S di equazione z = f(x,y) avra nel punto Po(x ,y , zo) il piano tangente 

Z - Zo = f x ( X - Xo ) + f y (y-y ). 

Dunque, se nella (A.3.1) ci si ferma ai termini lineari, la superficie S e approssimata dal 
suo piano tangente, arrestandosi ai termini di secondo grado S e approssimata da un 
paraboloide. 

Lo sviluppo (A.3.1) puo essere traslato nell'origine per semplicita. 

Se Po e un punto critico per / (quindi /° = f y = 0), allora il paraboloide approssimante 

e 

S:^ = .y./:,'- 2 + + .Of). (A.3.2) 

La matrice associata alia precedente forma quadratica e la matrice hessiana 



Hess(Po) 



J xx J xy 
Jyx Jyy, 



che, come e noto, in questo caso e non degenere. Piu in particolare si ha: 

det Hess(Po) > Hess e definita <^ Po ellittico 

detHess(Po) < <^ Hess e indefinita <^ Po iperbolico. 

Se Hess e definita positiva, allora Po e un punto di minimo relativo; se Hess e definita 
negativa, allora Po e un punto di massimo relativo. 

Riducendo a forma canonica la quadrica (A.3.2) si ha 

E: z = ^(\ 1 x 2 + \ 2 y 2 ). 

Se Po e ellittico, le sezioni di £ con i piani z = cost saranno ellissi; se Po e iperbolico, le 
sezioni di £ con i piani z = cost saranno iperboli. 
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I numeri reali Ai e A2 sono detti curvature principali di E in Pq, mentre K(Pq) = X1X2 
e detta curvatura gaussiana di E in P Q , quindi 



I concetti sopra esposti hanno senso non solo nei punti critici, ma anche in ogni punto 
della superficie, nell'ipotesi in cui esista il piano tangente ed il paraboloide approssimante. 
Basta considerare Hess(P ) e trovare det(Hess(P )). Se det(Hess(P )) = il punto si dice 
parabolico. 

Ad esempio un ellissoide ha tutti i punti ellittici, un iperboloide iperbolico ha tutti i 
punti iperbolici, un cono ed un cilindro hanno tutti i punti parabolici, mentre un toro ha 
punti di tutti e tre i tipi. 

Arrestando lo sviluppo di Taylor alia potenza n-esima si avra un paraboloide appros- 
simante di ordine n che e una superficie algebrica descritta da un polinomio di grado n, 
detto polinomio interpolante. 

A. 4 Polinomi di Bernstein 

I polinomi di Bernstein sono utilizzati in Analisi Matematica, Analisi Numerica ed 
Informatica Grafica con scopi differenti. Tuttavia, le proprieta che li rendono cosi im- 
portanti in campi diversi hanno un notevole interesse matematico che prescinde dalle 
applicazioni. 

Definizione A. 4. Si dicono polinomi di Bernstein di grado n i polinomi 



P ellittico <£> K(P ) > 0, 
P iperbolico <^> K(P ) < 0. 



Si dice curvatura media in P il numero 



H(P )= 1 -(\ 1 + \ 2 ). 




n—i 



I = 



ove, per n = 0, si pone B^it) = 1, e si pone Bf(t) = per % ^ {0, . . . ,n}. 
Lemma A.l. I polinomi di Bernstein soddisfano le seguenti proprieta. 

1. Bf{t) > perte [0,1]; 

2. B*{t) = B?Ul-t); 

I B?{t) = (l-t)Br 1 (t)+tBR{t); 

5. B™(t) ha un solo massimo (anche relativo) in [0, 1], per t = i/n. 
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DlMOSTRAZIONE. 

1. Banale. 

2. Immediata, tenendo conto dell'identita (") = ( "J. 

3. Si usi l'identita l — (t + (l — t)) n e la formula del binomio di Newton. 

4. Si usi l'identita 

n\ (n — 1\ (n — \ 

5. Basta vedere che d/dtBf(t) = per t = i/ra. 



Proposizione A. 2. / polinomi di Bernstein di grado n costituiscono una base di 
DlMOSTRAZIONE. Infatti, 

n (n-i\ n /j\ 

t i = m -t)+ tr-t = J2 = E ¥k B i^ ( A - 4 - 3 ) 

j=i \j) j=i \i) 

in tal caso la matrice di passaggio tra . . . , t n } e {-B™} e la matrice (X^) G W l + 1 ' n + 1 
tale che per i, j — 1, . . . , n + 1 




altrimenti, 

che e chiaramente non singolare. Iq^p 
Esempio A. 3. Si ha 

B l {t) = l-t, Bl(t)=t, 
Bl(t) = (l-t) 2 , Bl(t) = 2t{l-t), B 2 2 (t)=t 2 . 

Si noti che i polinomi soddisfano la proprieta relativa al loro massimo descritta sopra. 
Inoltre, Bf(t) per % — 0, . . . , n sono tutti di grado n; quindi un polinomio di grado minore 
od uguale ad n sara combinazione lineare di polinomi di grado uguale ad n. Per esempio 

13 

3t + 5 = 5B 2 (t) + y£i(i) + SB 2 2 (t). 
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Esprimendo 1, t, t 2 tramite B? 



(*)> 3 = !> 2 > 3 > si ha 



t=±B*(t) + B*(t), 

e = Bi(t). 



Esercizio A. 5. Con riferimento all'esempio precedente, si scrivano esplicitamente le 
matrici di passaggio dalla base monomiale a quella dei polinomi di Bernstein e viceversa. 

Nota A.l. I polinomi di Bernstein sonno stati introdotti dal matematico russo S. 
Bernstein per dimostrare il seguente teorema: sia f : [0, 1] — > R una funzione continua; 
allora esiste una successione {s„} ne N di combinazioni lineari di polinomi di Bernstein 
che tende ad f uniformemente. II teorema si esprime in maniera piu 'compatta' dicendo 
che Vinsieme dei polinomi e denso nelVinsieme delle funzioni continue, e mostra che 
ogni funzione continua puo essere approssimata da un polinomio (si veda [30] per una 
dimostrazione), anche se si prova che tale approssimazione e poco efficiente dal punto di 
vista numerico [2]. 

A. 5 Numeri modulari e crittografia 

II materiale qui presentato e tratto da [20]. 
A. 5. a Congruenze 

Definizione A. 5. Sia n G Z \ {0}, e siano x, y G Z. Diciamo che x ed y sono 
congruenti modulo n (x = y (mod n)) se x — y e un multiplo di n (ossia n\x — y). 

Osservazione A.l. La congruenza modulo n coincide con la congruenza modulo —n, 
quindi nel seguito considereremo solo congruenze con moduli positivi. 

Se n = 1 allora tutti i numeri sono congruenti. 

Esempio A. 4. 



La relazione di congruenza gode delle seguenti proprieta: per n G Z \ {0} 

1. x = x (mod n) (proprieta riflessiva ) ; 

2. x = y (mod n) =3- y = x (mod n) (proprieta simmetrica ) ; 

3. x = y (mod n) e y = z (mod n) x = z (mod n) (proprieta transitiva ). 
Dunque la relazione di congruenza modulo n e una relazione di equivalenza in Z. 



239 = 1 (mod 7) essendo 239 - 1 = 7 • 34; 
1845 = 3 (mod 8) essendo - 1845 -3 = 8- (-231); 
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Proposizione A. 3. Se n G Z \ {0} allora x = y (mod n) se e so/o se la divisione di 
x ed y per n da lo stesso resto. 

Dimostrazione. Siano 

x = qin + r 1 , y = q 2 n + r 2 . 

Se x = y (mod ra) , allora y — x = nk, quindi y = q\n + r\+nk = (qi + k)n + r\. Viceversa, 
se r\ = r 2 , risulta y — x = (q 2 — q\)n. In entrambi i casi il risultato segue dall'unicita del 
quoziente e del resto nella divisione. \qed\ 

Definizione A. 6. Sia x G Z. L'insieme degli y G Z tali che x = y (mod n) si dice 
classe di congruenza di x, e si indica con [x] n . 

Ovviamente, [x] n = [r] n , dove r e il resto della divisione di x per n. Fissato n, ci sono 
n distinte classi di congruenza: [0] n , [1]„,. . . [n — l] n . Esse si chiamano anche classi dei 
resti. Poniamo Z n = {[0] n , [l] n , ...,[n- l] n }. 

Esempio A.5. In Z 4 = {[0] 4 , [1] 4 , [2] 4 , [3] 4 } si ha 

[0] 4 = {x G Z | x : 4 ha resto 0} = {0, 4, 8, . . .} 
[1] 4 = {a; g Z | x : 4 ha resto 1} = {1, 5, 9, . . .} 

Dunque, [m] n G Z n ha la forma [m] n = {na + m | a G Z}. 

Se [x] n G Z n , ogni y G [x]„ si dice rappresentante di Ovviamente, i e un 

rappresentante di [x] n , e {0, 1, . . . , n — 1} sono rappresentanti per Z n . 

Esempio A. 6. {1024, 81, —18, —5} e un insieme di rappresentanti di Z 4 (verificarlo) . 
Valgono le seguenti proprieta: 

1. x = y (mod n) x + z = y + z (mod n); 

2. x = y (mod n) =>• a; 2; = yz (mod n). 

II viceversa della seconda proprieta non e valido: 14 = 2 (mod 12) ma 7^1 (mod 12). 
Definizione A. 7. Siano [x] n , [y] n G Z n , ed a G Z. Si definiscono le operazioni in Z n 

1. [x] n + [y] n = [x + y} n , somma , 

2- [x] n ■ [y\ n = [x ■ y] n , prodotto , 

3. a ■ [x] n = [a ■ x] n , prodotto per un intero. 

Si puo dimostrare facilmente che queste definizioni sono ben poste, cioe le definizioni 
non dipendono dai rappresentanti. 

Notiamo che la somma ed il prodotto di classi rendono (Z n , +, •) un anello commutativo 
con unita, detto anello delle classi di resti o anello dei numeri modulari. 
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Esempio A. 7. Le operazioni in Z2 e Z3. 





+ 


[0] 2 


[1] 2 




[0] 2 


[1] 2 






[o] 2 


[0] 2 


[1] 2 


[0] 2 


[0] 2 


[0] 2 






[1] 2 


[1] 2 


[0] 2 


[1] 2 


[0] 2 


[1] 2 




+ 


[0]s 


[l]s 


[2]s 




[0] 3 


[1] 3 


[2] 3 


[0]s 


[0]s 


[l]s 


[2]s 


[0]a 


[0] 3 


[0] 3 


[0]s 


[l]s 


[l]s 


[2] 3 


[0] 3 


[1] 3 


[0] 3 


[1] 3 


[2]s 


[2]s 


[2]s 


[0] 3 


[l]s 


[2] 3 


[0] 3 


[2] 3 


[l]s 



Consideriamo ora equazioni con incognite in Z„. Dati a, b G Z vogliamo trovare x G Z 
tale che 

1. [a]„ + [x] n = [b] n . In questo caso la soluzione e [x] n = [b] n — [a] n = [b — a] n ; 

2. [a] n ■ [x] n — [b] n . In questo caso la soluzione puo non esistere. 

Infatti, consideriamo in Z 4 l'equazione [2] 4 • [x] 4 = [1] 4 . Si hanno i seguenti prodotti in 
Z 4 : 

[2] 4 [0] 4 = [0] 4 , [2] 4 [1] 4 = [2] 4 , [2] 4 [2] 4 = [0] 4 , [2] 4 [3] 4 = [2] 4 , 

quindi non esiste [x] 4 G Z 4 tale che [2] 4 ■ [x] 4 = [1] 4 . Un esempio di equazione del tipo 
precedente che ammette soluzione in Z 4 e [3] 4 [x] 4 = [1] 4 . In generale si ha il seguente 
risultato, che non sara dimostrato. 

Proposizione A. 4. L'equazione [a] n [x] n = [l] n in Z n ha soluzione se e solo se a ed 
n sono coprimi, ovvero se e solo se MCD(a,n) = 1; in tal caso, la soluzione e unica 
(mod n). 

Esempio A. 8. L'equazione [27] 31 • [x] 3 i = [l] 3 i ha soluzione in Z 34 poiche 27 e 31 
sono coprimi. Troviamo x, y G Z tali che 27a; + 31y = 1 con l'algoritmo della divisione 
euclidea [8, 20]. Risulta x = — 8 e y = 7, da cui [27] J] 1 = [— 8] 31 = [23] 31. 

Dunque, gli elementi invertibili in Z„ sono tutte le classi [a] n tali che MCD(a,n) = 1. 
Vale la seguente ovvia conseguenza. 

Corollario A.l. L'anello Z n e un campo se e solo se n e un numero primo. 



A.5.b Applicazioni alia crittografia 



MITTENTE ~ RICEVENTE 

II mittente vuole spedire un messaggio M al ricevente in condizioni di sicurezza. Per fare 
cio, il mittente codifica il messaggio M secondo procedimenti che vedremo in seguito, 
trasformandolo in un messaggio N, e lo trasmette. II ricevente lo decodifica ed ottiene il 
messaggio M. 

L'obiettivo di questo paragrafo e applicare la teoria degli anelli Z n al precedente 
problema. 
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Codice 1 x 1 (o codice di sostituzione monoalfabetico) 

Consideriamo Z 26 , dove ogni classe di resto rappresenta una lettera in modo ovvio (ad 
esempio, [1] 2 6 = A, [2] 26 — B, ecc). Vogliamo trasmettere il messaggio "tanti auguri". 
Trasformiamo le lettere nei numeri corrispondenti 

TAN T I X A U G U R I 

20 1 14 20 9 24 1 21 7 21 18 9 (A.5.4) 

-6 1 -12 -6 9 -2 1 -5 7 -5 -8 9 

La terza stringa e stata ottenuta considerando i rappresentanti delle classi di resto aventi 
modulo minimo. 

Scegliamo un numero invertibile in Z 26 , ad esempio 5 (infatti [S]^ 1 = [— 5] 2 6 poi- 
che [5] 26 [— 5] 26 = [1] 2 6) Moltiplicando la terza stringa di (A.5.4) per 5 (modulo 26) e 
riconducendoci alle lettere si ottiene 

22 5 18 22 19 16 5 1 9 1 12 19 
VERVSPEAIALS (A.5.5) 

II ricevente trasformera l'ultima stringa nella stringa numerica corrispondente, poi otterra 
la stringa numerica corretta (cioe corrispondente al messaggio) moltiplicando tale stringa 
per —5 (modulo 26). Infatti 22 ■ (—5) = 20 (mod 26), che corrisponde a T, e cosi via. 

Ovviamente, questo codice e facilmente violabile perche ad ogni lettera del messaggio 
corrisponde la stessa lettera del messaggio codificato. Per ogni linguaggio sono facilmente 
reperibili le cosiddette analisi di frequenza, che danno le percentuali di utilizzo di ogni 
lettera dell'alfabeto in quel linguaggio. Con questi dati e possibile capire a quale lettera 
corrisponda un dato simbolo nel messaggio codificato, conoscendo il linguaggio utilizzato. 
Inoltre le chiavi possibili sono solo 12 (perche?). 



Codice matriciale 2 x 2 (o codice di sostituzione a blocchi) 

Scegliamo una matrice A e Z 2 g quadrata invertibile. Ad esempio 

3 13\ . x . , f-8 13 

-5 - 8 J' dQtA=1 6 \ 5 8 

Accoppiamo da sinistra i numeri della stringa corrispondente al messaggio del precedente 
sottoparagrafo (A.5.4) 
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Moltiplichiamo questi vettori per la matrice A, ottenendo 

8 13 \ /-6\ _ /17\ / 8 13\ / 9 \ _ /20\ / 8 13 \ / 7 \ _ /17 

-5 -8 ) v i J ~ v 22 / ' v~ 5 - 8 /v- 2 / v 23 /' v~ 5 - 8 /v- 5 /~ V 5 

8 13 \ /-12\ _ (8\ f 8 13\ / 1 \ _ /2l\ / 8 13 \ f-8\ _ f 1 

-5 -8jl-6j~U/' 1-5 -8 [-5 ~\9r 1-5 — 8 J V 9 / _ V 20 



Otteniamo il messaggio codificato 



17 22 8 4 20 23 21 9 17 5 1 20 
QVHDTWUIQEAT 



(A.5.6) 



II ricevente, ottenuta la stringa alfabetica precedente, la trasforma nella corrispondente 
stringa numerica, poi accoppia i numeri e moltiplica i vettori cosi ottenuti per A^ 1 : 



-8 13\ fl7\ (20 



5 8 ) \ 22 



i • • • 



ottenendo la stringa numerica corrispondente al messaggio. 

Anche questo codice non e molto sicuro. Per aumentarne la sicurezza si puo passare 
ad un codice 3x3. Oppure, si puo aumentare la lunghezza dell'alfabeto includendo, ad 
esempio, i simboli !, ?, ecc. passando ad un alfabeto a 31 simboli. Essendo 31 primo, 
risulta y?(31) = 30 1 , quindi aumentano le possibili chiavi. Inoltre, e facile rendersi conto 
del fatto che questo codice non e sensibile alle analisi di frequenza, poiche la codifica di 
ogni lettera dipende da altri simboli (un altro simbolo nell'esempio considerato, 2 simboli 
nel caso di un codice 3x3, ecc). 



1 Qui ip rappresenta V indicatore di Eulero, ovvero la funzione che assegna ad ogni numero naturale 
n e N il numero dei numeri naturali 1 < k < n che sono primi con n, ovvero tali che k ed n non hanno 
divisori in comune. Ovviamente ip(p) = p — 1 se p e primo. 
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